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Sekretion von tragergebundenen Proteinen in das Peripiasma und in den 
extrazellularen Raum 

Beschreibung 

Die vorliegende Erfindung betrifft Verfahren zur Hersteilung von tra- 
gergebundenen Proteinen, insbesondere von S-Layer-Proteinen und modifi- 
zierten S-Layer-Proteinen in pro- oder eukaryontischen Wirtszellen. 

Kristalline bakterieile Zelloberflachenlayer (S-Layer) bilden in vielen 
Eubakterien und den allermeisten Archaebakterien die aufcerste Zellwand- 
komponente (Sleytr et al. (1988), Crystalline Bacterial Cell Surface Layers, 
Springer Veriag Berlin; Messner und Sleytr, Adv.Mikrob.Physiol.33 (1992), 
21 3-275). Die meisten der gegenwartig bekannten S-Layer-Proteine sind aus 
identischen Proteinen bzw. Glykoproteinen zusammengesetzt, die schein- 
bare Molekulargewichte im Bereich von 40 000 bis 220 000 aufweisen. Die 
Komponenten von S-Layern sind seibst-assembiierend und die meisten 
Gitter haben eine schrage (p2), quadratische (p4) oder hexagonaie (p6) 
Symmetrie. Die Funktionen von bakteriellen S-Layern sind immer noch nicht 
vollstandig bekannt, aber aufgrund ihrer Lokalisierung an der Zelloberflache 
durften die porosen kristaliinen S-Layer hauptsachlich als Schutzhullen, 
Molekularsiebe oder zur Forderung der Zelladhasion und Oberflachen- 
erkennung dienen. 

Genetische Daten und Sequenzinformationen sind fur verschiedene S-Layer- 
Gene aus Mikroorganismen bekannt. Eine Obersicht findet sich bei Peyret 
et al., Mol.Microbioi.9 (1993), 97-109. Auf diese Daten wird ausdrucklich 
Bezug genommen. Die Sequenz des fur das S-Layer-Protein von B.stearo- 
thermophilus PV72 kodierenden Gens sbsA und ein Verfahren zu dessen 
Klonierung sind bei Kuen et al. (G n 145 (1994), 1 15-120) angegeben. 
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B.stearothermophilus PV72 istein gram-positives Bakterium, das mit einem 
hexagonal angeordneten S-Layer bedeckt ist. Die Hauptkomponente des S- 
Layer istein 1 28 kd-Protein, bei dem es sich um das haufigste Protein in der 
Zeile mit einem Anteil von ungefahr 1 5% bezuglich der gesamten Proteinbe- 
standteile handelt. Es sind verschiedene Stamme von B.stearothermophilus 
charakterisiert worden, die hinsichttich des Typs von S-Layer-Gitter, dem 
Molekulargewicht und der Glykosilierung der S-Layer-Komponenten 
unterschiediich sind (Messner und Sleytr {19921, supra). 

Die deutsche Patentanmeldung DE-OS 44 25 527 offenbart den Signalpep- 
tid-kodierenden Abschnitt des S-Layer-Gens aus B.stearothermophilus und 
die da von abgeleitete Aminosauresequenz. Die Spaltstelle zwischen dem 
Signalpeptid und dem reifen Protein befindet sich zwischen Position 30 und 
31 der Aminosauresequenz. Die Signalpeptid-kodierende Nukleinsaure kann 
operativ mit einer Protein-kodierenden Nukleinsaure verknupft werden und 
zur rekombinanten Herstellung von Proteinen in einem Verfahren verwendet 
werden, bei dem man eine transformierte Wirtszelle bereitstellt, die 
Wirtszelle unter Bedingungen kultiviert, die zu einer Expression der 
Nukleinsaure und zu einer Erzeugung und Sekretion des davon kodierten 
Polypeptids ftihren, und das resultierende Polypeptid aus dem Kulturmedium 
gewinnt. Als Wirtszellen werden vorzugsweise prokaryontische Organismen, 
insbesondere gram-positive Organismen der Gattung Bacillus genannt. 

In der internationalen Patentanmeldung PCT/EP97/00432 wird die rekom- 
binante Herstellung von S-Layer- Proteinen und modifizierten S-Layer- 
Proteinen im Cytoplasma gram-negativer Wirtszellen vorgeschlagen. 

Oberraschenderweise wurde nun festgestellt, daB die rekombinante 
Herstellung von S-Layer-Proteinen nicht nur im Cytoplasma gram-negativer 
prokaryontischer Wirtszellen moglich ist, sondern daB auch eine rekom- 
binante Expression durchgefuhrt werden kann, die ein integration in der 
auBeren oder der cytoplasmatischen Membran, in Sekretion in das 
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Periplasma oder/und eine Sekretion in den extrazellularen Raum umfafct. 
Daruber hinaus wurde festgestellt, daB eine rekombinante Expression von 
S-Layer-Proteinen auch in eukaryontischen Wirtszellen gelingt. 

Ein erster Aspekt der vorliegenden Erfindung ist somit ein Verfahren zur 
Herstellung von S-Layer Proteinen, dadurch gekennzeichnet, daS man 

(a) eine gram-negative prokaryontische Wirtszelle bereitstellt, die 
transformiert ist mit einer fur ein S-Layer-Protein kodierenden Nu- 
kleinsaure in operativer Verknupfung mit einer Signalsequenz, die fur 
ein Peptid kodiert, das eine Integration des S-Layer-Proteins in der 
au&eren Membran der Wirtszelle, eine Integration des S-Layer- 
Proteins in der cytoplasmatischen Membran der Wirtszelle, eine 
Sekretion des S-Layer-Proteins in den periplasmatischen Raum der 
Wirtszelle oder/und eine Sekretion in das die Wirtszelle umgebende 
Medium bewirkt, 

(b) die Wirtszelle unter solchen Bedingungen kultiviert, die zu einer 
Expression der Nukleinsaure und zu einer Erzeugung des davon 
kodierten Poiypeptids fuhren und 

{c) gegebenenfalls das resultierende Polypeptid aus der aulieren 
Membran der Wirtszelle, cytoplasmatischen Membran der Wirtszelle, 
aus dem periplasmatischen Raum der Wirtszelle oder/und aus dem die 
Wirtszelle umgebenden Medium gewinnt. 

Ein zweiter Aspekt der vorliegenden Erfindung ist ein Verfahren zur 
Herstellung von S-Layer-Proteinen, dadurch gekennzeichnet, daft man 
(a) eine eukaryontische Wirtszelle bereitstellt, die transformiert ist mit 
einer fur ein S-Layer-Protein kodierenden Nukleinsaure vorzugsweise 
in operativer Verknupfung mt einer Signalsequenz, die eine Integra- 
tion des S-Layer-Proteins in der cytoplasmatischen Membran der 
Wirtszelle, ein Integration des S-Layer-Proteins in ein Organelle d r 
Wirtsz He der/und einer Sekretion in das di Wirtsz lie umgebend 
Medium bewirkt, 
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(b) die Wirtszelle unter solchen Bedingungen kultiviert, die zu einer 
Expression der Nukleinsaure und zu einer Erzeugung des davon 
kodierten Polypeptids fuhren und 

(c) gegebenenfalls das resultierende Polypeptid aus der cytoplasmati- 
schen Membran der Wirtszelle, einer Organelle der Wirtszelle 
oder/und aus dem die Wirtszelle umgebenden Medium gewinnt. 

Clberraschenderweise wurde festgestellt, daft eine Sekretion beliebiger 
heterologer S-Layer-Proteine, auch rekombinanter S-Layer-Proteine in den 
periplasmatischen Raum einer gram-negativen Wirtszelle oder sogar eine 
Sekretion in das die Wirtszelle umgebende Medium moglich ist. Dabel bildet 
sich das S-Layer-Protein im Periplasma der Wirtszelle nicht in Form von 
ungeordneten EinschluRkorpern, sondern unerwarteterweise in Form von 
geordneten monomolekularen Schichten. Aufcerdem ist eine Verankerung 
von heterologen S-Layer-Proteinen in der aulSeren oder der cytoplasmati- 
schen Membran von gram-negativen Wirtszellen m6glich. 

Auch in eukaryontischen Zellen wie etwa Saugerzellen oder Hefe konnen S- 
Layer-Proteine in funktionaler Form exprimiert werden. Bei rekombinanten 
S-Layer-Proteinen, die einen eukaryontischen Fusionsanteil tragen, findet 
eine Glykosilierung statt. Aufcerdem kann im S-Layer-Proteinanteil selbst 
eine Glykosilierung stattfinden. 

Vorzugsweise ermoglicht das erfindungsgemaRe Verfahren die Expression 
von S-Layer-Genen, die aus B.stearothermophilus PV72 stammen, 
insbesondere die Expression der S-Layer Gene sbsA und sbsB. Daneben 
konnen aber auch S-Layer-Gene aus anderen Organismen (vgl. z.B. Peyret 
et al., (1993) supra} durch das erfindungsgemaSe Verfahren exprimiert 
werden. 

Die Nukleotidsequenz des fur das reif SbsA-Protein kodier nden Gens ist 
in SEQ ID No. 1 von Position 91-3684 angegeben. Die zugehdrig 
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Aminosauresequenz ist in SEQ ID No. 2 dargestellt. Die Nukleotidsequenz 
des fur das reife SbsB-Protein kodierenden Gens ist in SEQ ID No. 5 von 
Position 94-2763 angegeben. Die zugehorige Aminosauresequenz ist in SEQ 
ID No. 6 dargestellt. 

In einer ersten bevorzugten Ausfuhrungsform (sbsA) wird die Nukleinsaure, 
die fur ein S-Layer-Protein kodiert, ausgewahlt aus 
|i) einer Nukleinsaure, welche die von Position 91 bis 3684 in SEQ ID 
No. 1 gezeigten Nukleotidsequenz umfafct, 

(ii) einer Nukleinsaure, welche eine der Nukleinsaure aus 0) im Rahmen 
der Degeneration des genetischen Codes entsprechende Nukleotidse- 
quenz umfaSt, und 

(iii) einer Nukleinsaure, welche eine mit den Nukieinsauren aus (i) 
oder/und (ii) unter stringenten Bedingungen hybridisierende Nukleotid- 
sequenz umfaBt. 

In einerzweiten bevorzugten Ausfuhrungsform (sbsB) wird die Nukleinsaure, 
die fur ein S-Layer-Protein kodiert, ausgewahlt aus 

(i) einer Nukleinsaure, welche die von Position 94 bis 2763 in SEQ ID 
No. 5 gezeigte Nukleotidsequenz umfafct, 

(ii) einer Nukleinsaure, welche eine der Nukleinsaure aus (i) im Rahmen 
der Degeneration des genetischen Codes entsprechenden Nukleotid- 
sequenz umfafct und 

(iii) einer Nukleinsaure, welche eine mit den Nukieinsauren aus (i) 
oder/und (ii) unter stringenten Bedingungen hybridisierende Nukleotid- 
sequenz umfafct. 

Unter dem Begriff "stringente Hybridisierung" im Sinne der vorliegenden 
Erfindung versteht man, dafc eine Hybridisierung auch nach Waschen bei 
55 °C, vorzugsweise 60°C, in inem wafcrigen Niedrigsalz-Puffer (z.B. 0,2 
x SSC) noch auftritt (s. auch Sambrook et al. (1989), Molecular Cloning. A 
Laboratory Manual). 
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GemaS dem ersten Aspekt der Erfindung werden gram-negative prokar- 
yontische Wirtszellen verwendet. Dabei wird Qberraschenderweise im 
Periplasma eine geordnete assemblierte S-Layer-Proteinstruktur erhalten. 
Vorzugsweise werden als Wirtszellen Enterobakterien, insbesondere E.coli, 
verwendet. Beispiele fur geeignete E.coli Stamme sind DH5a (sup E44, A 
lac U1 69, hsdR17, recAl, endA1 , gyr A96, thi-1, rel A1 ; Hanahan, J. Mol. 
Biol. 166 (1983), 557-580} und HB2151 (K12, ara, A (lac-pro), thi/F, pro 
A + B + , laclqZAM15; Pharmacia Biotech). 

GemaB dem zweiten Aspekt der Erfindung werden eukaryontische 
Wirtszellen verwendet. Vorzugsweise verwendet man Hefezellen, Sauger- 
zellen wie etwa CHO Zellen Oder humane Zellen, Insektenzellen oder 
Pflanzenzellen. 

Das erfindungsgemafce Verfahren kann auch zur Gewinnung rekombinanter 
S-Layer-Proteine eingesetzt werden. Hierzu verwendet man eine fur das S- 
Layer-Protein kodierende Nukleinsaure, die eine oder mehrere Insertionen 
enthalt, die fur Peptid- oder Polypeptidsequenzen kodieren. Diese Insertio- 
nen konnen einerseits nur fur Peptide mit wenigen Aminosauren, z.B. 1-25 
Aminosauren, kodieren. Andererseits konnen die Insertionen auch fur 
groftere Polypeptide von z.B. bis zu 1000 Aminosauren und vorzugsweise 
bis zu 500 Aminosauren kodieren, ohne da& die Fahigkeit des S-Layer- 
Proteins zur Ausbildung einer korrekt gefalteten Struktur verlorengeht. 
Neben den Insertionen kann das rekombinante S-Layer-Protein auch 
Aminosauresubstitutionen. insbesondere Substitutionen einzelner Aminosau- 
ren im Bereich der Insertionsorte sowie gegebenenfalls Deletionen einzelner 
Aminosauren oder kurzer Aminosaureabschnitte von bis zu 30 Aminosauren 
aufweisen. 

Als Insertionsstellen fur Peptid- od r Polypeptid-kodierend Sequenz n in 
das sbsA-Gen bevorzugt sind Bereiche zwischen den Positionen 200-3600 
d r in SEQ ID NO.1 gezeigten Nukleotidsequenz. Besonders bevorzugte 
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Insertionsstellen sind die Nrul-Schnittstelle an Position 585, die Pvull- 
Schnittstelle an Position 881, die SnaB-l-Schnittstelle an Position 920, die 
Pvull-Schnittstelle an Position 2507 und die Pvull-Schnittstelle an Position 
2652 (PCT/EP 97/00 432). Weitere bevorzugte Insertionsstellen sind die 
Positionen 562, 1087, 1813, 1947, 2295, 2652, 3046, 3484 und 3594. 
Die jeweils angegebenen Positionen beziehen sich auf das erste Nukleotid 
der Insertion. 

Als Insertionsstellen in das sbsB-Gen bevorzugt sind Bereiche zwischen den 
Positionen 200-2600 der in SEQ ID No. 5 gezeigten Nukleotidsequenz. 
Besonders bevorzugte Insertionsstellen sind die Positionen 410 (Codon 
136), 484 (Codon 161/162) und 1583 (Codon 528/529) (PCT/EP 
97/00432). Weitere bevorzugte Insertionsstellen sind die Positionen 598, 
1012, 1435, 1808 und 2301, wobei sich die jeweils angegebene Position 
auf das erste Nukleotid der Insertion bezieht. 

Die Pepttd- oder Polypeptid-kodierenden Insertionen werden vorzugsweise 
ausgewahlt aus Nukleotidsequenzen, die ftir Cysteinreste, Bereiche mit 
mehreren geladenen Aminosauren, z.B. Arg. Lys, Asp oder Glu, oder Tyr- 
Resten, DNA-bindende Epitope, antigene, allergene oder immunogene 
Epitope, metallbindende Epitope, Streptavidin, Enzyme, Cytokine oder 
Antikorper-bindende Proteine kodieren. 

Ein besonders bevorzugtes Beispiel fur eine Insertion in die fur das S-Layer- 
Protein kodierende Nukleinsaure ist eine fur Streptavidin kodierende 
Nukleotidsequenz. Auf diese Weise konnen universelle Tragermolekule 
erhalten werden, die zur Ankopplung von biotinylierten Reagenzien an das 
integrierte Streptavidin des rekombinanten S-Layerproteins und zum 
Nachweis in immunologischen oder Hybridisierungstestverfahren geeignet 
sind. 
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Ein weiteres bevor2ugtes Beispiel fOr Insertionen sind antigene, allergene 
oder immunogene Epitope, z.B. Epitope a us pathogenen Mikroorganismen, 
wie etwa Bakterien, Pilzen, Parasiten etc. und Viren, oder Epitope aus 
Pflanzen oder Epitope gegen korpereigene Substanzen, z.B. Cytokine, sowie 
gegen Toxine, insbesondere Endotoxine. Besonders bevorzugte Beispiele fur 
immunogene Epitope sind Epitope aus Viren, z.B. aus Herpesviren, wie etwa 
Herpesvirus 1 , z.B. Glykoprotein A, Herpesvirus 6 oder Pseudorabiesvirus 
{Lomniczi et al., J. Virol. 49 (1984}, 970-979), insbesondere Epitope aus 
den Genen gB, gC oder/und gD, Epitope aus Maul- und Klauenseuchevirus 
(FMDV), insbesondere Epitope aus den Genabschnitten, die fQr VP1, VP2 
oder/und VP3 kodieren. Epitope aus Flaviviren oder Epitope aus Filoviren 
wie etwa Eboia-, Marburg- oder Lassavirus. Die immunogenen Epitope 
konnen so ausgewahlt werden, dais sie die Erzeugung einer Antikorper- 
vermittelten Immunreaktion fordern oder/und die Erzeugung einer zellularen 
Immunreaktion, z.B. durch Stimulation von T-Zellen. fordern. Beispiele fur 
geeignete allergene Epitope sind Birkenpollenailergene, z.B. Bet v I {Ebner 
et al., J. Immunol. 1 50 (1993) 1047-1054). Weiterhin besonders bevorzugt 
sind antigene Epitope, die in der Lage sind, aus Serum oder anderen Korper- 
flussigkeiten korpereigene oder korperfremde Substanzen wie etwa Cytokine 
oder Toxine zu binden und herauszufiltrieren. Derartige Epitope konnen 
Bestandteile von Cytokin- oder Toxinrezeptoren oder von Antikorpern gegen 
Cytokine oder Toxine umfassen. 

Modifizierte S-Layer-Proteine, die immunogene oder/und antigene Epitope 
mit Glykosilierungsstellen aufweisen, werden vorzugsweise in eukaryonti- 
schen Wirtszellen hergestellt, in denen eine Glykosilierung moglich ist. Dabei 
kSnnen auch die naturlichen S-Layer-Sequenzen glykosiliert werden. 
Beispiele fur potentielle N-Glykosilierungsstellen im S-Layer-Gen sbsA sind 
die Aminosaurepositionen 26, 285, 343, 384, 387, 388, 418, 421, 483, 
653, 675, 902, 924, 1048, 1058, 1118, 1154 und 1 161. Im sbsB-Gen 
kann eine potenttell N-Glykosilierung an den Positionen 155, 184, 213, 
302, 303, 400, 463, 606, 755 und 915 stattfinden. Weitere mogliche 
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Modifikationen des sbsA-Gens umfassen Amidierung, Phosphorylierung 
durch Caseinkinase II, N-Myristoyiierung und Phosphorylierung durch 
Proteinkinase C. Weitere mogllche Modifikationen des sbsB Gens umfassen 
Phosphorylierung durch cAMP- und cGMP-abhangige Proteinkinase, 
Phosphorylierung durch Caseinkinase II, N-Myristoylierung, Phosphorylie- 
rung durch Proteinkinase C und Anlagerung an einen Fibronectin Rezeptor 
(uber Sequenz RGD). 

Andererseits konnen die Insertionen auch fur Enzyme kodieren. Bevorzugte 
Beispiele sind Enzyme zur Synthese von Polyhydroxybuttersaure, z.B. PHB- 
Synthase. Durch Einbau von PHB-Synthase in den S-Layer kann bei Zufuhr 
des Substrats Hydroxybuttersaure unter geeigneten Bedingungen eine 
molekulare Spinnduse entstehen. Ein weiteres bevorzugtes Beispie! fur ein 
Enzym ist bakterielle Luciferase. Hier kann bei Zufuhr des Enzymsubstrates, 
eines Aldehyds, sowie FMNH 2 {reduziertes Flavinmononukleotid), und in 
Anwesenheit von 0 2 ein molekularer Laser erhalten werden. 

Ebenfalls bevorzugt sind Insertionen, die fur Cytokine, wie etwa Inter- 
leukine, Interferone oder Tumornekrosefaktoren kodieren. Diese Molekule 
konnen beispielsweise in Kombination mit immunogenen Epitopen zur 
Herstellung von Vakzinen verwendet werden. 

SchlieBiich sind auch Insertionen bevorzugt, die fur Antikorper-bindende 
Proteine, wie etwa Protein-A oder Protein-G oder fur DNA- oder/und 
metallbindende Epitope, wie etwa Leucin-Zipper, Zinkfinger etc. kodieren. 

So wird durch die vorliegende Erfindung erstmals eine gram-negative 
prokaryontische Zelle bereitgestellt, die in der auReren Membran, in der 
cytopiasmatischen Membran, vorzugsweise an deren Innenseite oder/und 
im Periplasma immobiiisi rte rekombinante Polypeptide in nativer Form, z. 
B. aktive Enzyme enthaMt. Pro mm* rekombinanten S-Layer k6nnen auf di se 
Weise 50.000 - 200.000, z.B. ca. 100.000 rekombinante Molekule 
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immobilisiert werden. Pro kg rekombinante E.coli Zeilen konnen bis zu 
3.000 m 2 S-Layer erhalten werden. 

Weiterhin wird durch die vorliegende Erfindung erstmals eine eukaryontische 
Zelle bereitgestellt, die in der cytoplasmatischen Membran, vorzugsweise 
an deren Innenseite oder/und in Zellorganellen wie etwa Golgi, Lysosomen, 
Mitochondrien, Chloroplasten, Vacuolen oderendoplasmatisches Reticulum 
immobidsierte rekombinante S-Layer-Polypeptide enthalt. 

Daruber hinaus sind insbesondere fur die Sekretion ins Periplasma rekom- 
binante S-Layerproteine bevorzugt, in die Cysteinreste eingebaut wurden. 
Durch Auswahl der Insertionspositionen kann ein kovalentes CrossNnking 
der S-Layer im Periplasma erreicht werden oder/und bei Insertion an nicht 
zum Crosslinking geeignete Positionen konnen Andockstellen fur Polypepti- 
de, z.B. fur Enzyme, bereitgestellt werden, die uber eine freie SH-Gruppe 
kovalent mit dem S-Layer verknupft werden konnen. Besonders bevorzugt 
eignen sich hierzu rekombinante Polypeptide, in die durch gentechnische 
Methoden ein zusatzlicher Cysteinrest, vorzugsweise am N- oder am C- 
Terminus oder an einer oberftacheniokalisierten Domane eingefuhrt wurde 
und die durch Auswahl Bines geeigneten Expressionssystems ebenfalls ins 
Periplasma der rekombinanten Wirtszelle sekretiert werden. 

Bei dem erfindungsgemaften Verfahren wird die fur das S-Layer-Protein 
kodierende Nukleinsaure in operativer Verkniipfung mit einer fur ein 
Signalpeptid von gram-negativer Bakterien oder von eukaryontischen Zellen 
kodierenden Nukleinsaure verwendet, d.h. 5'-seitig von der S-Layer-Protein- 
kodierenden Nukleinsaure ist die Signalpeptid-kodierende Nukleinsaure 
angeordnet. 

Bei iner Integration in die SuRere Membran prokaryontischer gram-negativer 
Wirtszeflen kann als Signalpeptid-kodierende Sequenz die C-terminale 
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Domane der IgA-Protease aus Neisseria oder Haemophilus (Klauser et al., 
J. Mol. Bio. 234 (1993), 579-593) verwendet werden. 

Bei einer Integration in die cytoplasmatische Membran gram-negativer 
prokaryontischer Wirtszellen wird vorzugsweise ein hydrophobe, nicht 
lytisch wirkende membra nintegrierende Proteindomane, die eine ar-helikale 
Struktur besitzt, verwendet. Beispiele von DNA-Sequenzen, die fur eine 
solche membranintegrierende Proteindomane kodieren, sind im europaischen 
Patent 0 516 655 beschrieben. 

Bei einer Sekretion ins Periplasma gram-negativer prokaryontischer Zellen 
kann die fur das Signaipeptid kodierende Nukleinsaure (a) den Signalpeptid- 
kodierenden Abschnitt der in SEQ ID No. 7 bzw. Fig. 4 dargestellten 
Nukleotidsequenz, (b) eine der Sequenz aus (a) im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenz oder/und (c) eine 
zu den Sequenzen aus (a) oder/und (b) mindestens 80% und insbesondere 
mindestens 90% homologe Nukleotidsequenz umfassen. Andere Sequenzen, 
die eine Sekretion ins Periplasma bewirken, sind beispielsweise bei Blondel 
und Bedouelle (Eur. J. Biochem 193 (1990), 325-330; Adip-Conquy et al. 
(Protein Eng. 8 (1995), 859-863); Weller et al (Eur. J. Biochem. 236 
(1996), 34-39) und Dubreuil et al. (FEMS Immunol. Med. Microbiol. 13 
(1996), 317-323) beschrieben. 

Bei einer Sekretion ins extrazellulare Medium gram-negativer prokaryonti- 
scher Zellen kann die fur das Signaipeptid kodierende Nukleinsaure (a) den 
Signalpeptid-kodierenden Abschnitt der in SEQ ID No. 8 bzw. Fig. 5 
dargestellten Nukleotidsequenz, (b) eine der Sequenz aus (a) im Rahmen der 
Degeneration des genetischen Codes entsprechende Nukleotidsequenz 
oder/und (c) eine zu d n Sequenzen aus (a) oder/und (b) mindestens 80% 
und insbesondere mindestens 90% homologe Nukleotidsequenz umfassen. 
Daruber hinaus sind aber auch andere Signalpeptid-kodierende Sequenzen 
geeignet wie etwa von Yuan et al. (Appl. Environ. Microbiol. 63 (1997), 
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263-269) und Hoogenboom et ai. (Nucleic Acids Res. 19 (1991), 4133- 
4137) beschrieben. 

Fur die Expression in der cytoplasmatischen Membran oder in Organellen 
eukaryontischer Zellen sind als Signalpeptid-kodierende Nukleinsauren das 
N-terminale Transitpeptid von Plastocyanin fur den Transport in Chloropla- 
sten (Weisbeek et aL f J. Cell. Sci. Suppl. 1 1 (1989), 1 99-223), mitrochon- 
driale Signalpeptide fur den Transport in Mitochondrien (Skerjanc, Biochem. 
Cell. Biol. 68 (1990), 9-16), Targetingsequenzen fur den Transport in 
Vakuolen (Vitale und Chrispeels, Bioessays 14 (1992), 151-160), Targe- 
tingsequenzen fur die Zellmembran, das Cytoplasma und den Golgiapparat 
(Stanley, Mol. Membr. Biol. 13 (1996), 19-27), Retentionssignale fur das 
endoplasmatische Reticulum (Lencer et al., J. Cell. Bio!. 131 (1995), 951- 
962) und Transfersequenzen fQr den Golgiapparat oder die Plamsmamem- 
bran (Rambourg et al., Anat. Rec. 245 (1996), 447-458) bekannt. 

Fur die Sekretion ins extrazellulare Medium eukaryontischer Zellen sind als 
Signalpeptid-kodierende Nukleinsauren der hsp 1 50 Delta-Carrier (Jamsa et 
al., Yeast 11 (1995), 1381-1391), das Signalpeptid von Melittin aus der 
Honigbiene (Sisk et al., J. Virol 68 (1994), 766-775), Signalpeptide aus 
Baculovirus (Murphy et al., Protein Expr. Purif. 4 (1993), 349-357), Frag- 
mente des K1 Killerpraprotoxins (Cartwright et al.. Yeast 8 (1992), 261- 
272), das Signalpeptid und die N-terminale Proregion von Peptidylglycin a~ 
hydroxylierender Monooxygenase (Mains et al., Mol. Endocrinol. 9 (1995), 
3-13), das Maltose-Bindeprotein MalE mit dessen Signalsequenz (Staropoli 
et al., J. Virol. Methods 56 (1996), 179-189; Clement und Jehanna, J. 
Biotechnol.43(1995), 1 69-1 81), diePrapro-a-Faktor-Leaderregion desHefe 
MF a 1 Gens (Elliot et al., Gene 79 (1989), 167-180), die Signalsequenz 
des 1L-1 Rezeptorantagonisten (Wingren et ai., Cell Immunol. 169 (1996), 
226-237), das Signalpeptid des Weiz n-o-Amylasegens (Ribbe und 
Nagarajan, Mol. G n. Genet. 235 (1992), 333-339), S kretionspolypeptide 
aus Pilzen (Punt etal., AntonieVan Leeuwenhoek 65 (1994), 21 1-216), das 
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Leaderpeptid des Killertoxins aus Kluyveromyces lactis (Baldari et al., EMBO 
J. 6 (1987), 229-234) und die Inuiinasesignalsequenz (Kang et a!., J. 
Biotechnol. 48 (1996), 15-24) bekannt. Fusionskonstrukte aus MalE und 
SbsA sowie aus MalE und SbsB sind in der vorliegenden Anmeldung 
beschrieben. 

Neben dem fur das Signalpeptid kodierenden Abschnitt kann die fur das S- 
Layer-Protein kodierende DNA-Sequenz einen oder mehrere weitere 
Abschnitte enthalten, die fur weitere Proteindomanen kodieren. Ein solcher 
Abschnitt kann vorzugsweise zwischen dem fur das Signalpeptid kodieren- 
den Abschnitt und dem fiir das S-Layer- Protein kodierenden Abschnitt 
angeordnet sein. Vorzugsweise kodiert dieser Abschnitt fur ein sekretori- 
sches Polypeptid aus gram-negativen bakteriellen oder eukaryontischen 
Organismen oder einen Teil davon. Ein bevorzugtes Beispiel fiir einen 
solchen Nukleinsaureabschnitt ist das malE Gen, welches das Maltose- 
Bindeprotein kodiert. 

In einer bevorzugten Ausfuhrungsform des erfindungsgemafcen Verfahrens 
konnen auch mehrere S-Layer-Gene in einer einzigen Wirtszelle exprimiert 
werden. Vorzugsweise werden zu diesem Zweck mindestens zwei S-Layer- 
Gene exprimiert, wobei eines davon fur ein modifiziertes S-Layer-Protein.und 
ein anderes fur ein nicht modifiziertes S-Layer- Protein kodiert. Das nicht 
modifizierte S-Layer-Protein ist vorzugsweise in der Lage, eine mit dem 
modifizierten S-Layer-Protein kompatible S-Layer-Struktur auszubilden. Ein 
Beispiel fur diese Ausfuhrungsform des erfindungsgemSGen Verfahrens ist 
eine E.coli Zelie, welche mit zwei S-Layer-Genen transformiert ist, von 
denen eines ein natOrliches sbsA- oder sbsB-Gen ist und das andere ein 
rekombinantes sbsA- oder sbsB-Gen ist. 

Noch ein weiterer Gegenstand d r vorliegenden Erfindung ist in Nu- 
kl insaur , die fiir ein gegeben nfalls heterologe Peptid- od r Polypeptidin- 
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sertionen enthaltendes S-Layer- Protein kodiert und in operativer Ver- 
knupfung mit einer Signalsequenz ist, die fur ein Peptld kodiert, das 

(a) eine Integration in die auSere oder cytoplasmatische Membran einer 
gram-negativen prokaryontischen Wirtszelle, eine Sekretion in den 
periplasmatischen Raum einer gram-negativen prokaryontischen 
Wirtszelle oder/und eine Sekretion in das extrazeliulare Medium einer 
gram-negativen prokaryontischen Wirtszelle, oder 

(b) eine Integration in die cytoplasmatische Membran einer eukaryonti- 
schen Wirtszelle, eine Integration in eine Organelle einer eukaryonti- 
schen Wirtszelle oder/und eine Sekretion in das extrazeliulare Medium 
einer eukaryontischen Wirtszelle bewirkt. 

Vorzugsweise kodiert die Nukleinsaure fur ein rekombinantes S-Layer- 
Protein wie zuvor angegeben. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein rekombinanter 
Vektor, der mindestens eine Kopie einer erfindungsgemafien Nukleinsaure 
enthalt. Der Vektor ist vorzugsweise in Prokaryonten oder/und in Eukaryon- 
ten replizierbar. Besonders bevorzugt ist der Vektor ein prokaryontisches 
oder ein eukaryontisches Piasmid. Weiterhin ist bevorzugt, daft der Vektor 
die erfindungsgemSRe Nukleinsaure in operativer Verknupfung mit einer in 
gram-negativen oder eukaryontischen Zellen aktiven Expressionskontroll- 
sequenz ist. Besonders bevorzugt umfaftt die Expressionskontrollsequenz 
einen regulierbaren Promotor. Beispiele fur geeignete prokaryontische 
Promotoren sind der tac-, lac-, trp- oder yl-Promotor. Beispiele fur geeignete 
eukaryontische Promotoren sind der SV40-, CMV- oder Metallothionein- 
Promotor. 

Noch ein weiter r Geg nstand der vorliegenden Erfindung ist eine Wirtszelle, 
die mit einer Nukleinsaure oder einem rekombinanten Vektor gemaft 
vorliegender Erfindung transformiert ist. Vorzugsw ise ist die Zelle eine 
gram-negativ prokaryontische Zelle, z.B. eine E.coli-Zelle, oder in 
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eukaryontische Zelle, z.B. eine Hefezeile oder eine CHO-Zelle. Die erfin- 
dungsgemafce Zelle kann der cytoplasmatischen Membran, dem Peripiasma 
oder einer Zellorganelle eine rekombinante S-Layerstruktur enthalten. 
Verfahren zur Transformation von Zellen mit Nukleinsauren sind ailgemeiner 
Stand der Technik {siehe Sambrook et al., supra} und brauchen daher nicbt 
erlautert zu werden. 

Aus rekombinanten S-Layer-Proteinmolekulen kann eine rekombinante S- 
Layer-Struktur assembliert werden, die als Untereinheit mindestens ein 
erfindungsgemafces rekombinante s S-Layer-Protein enthait. Weiterhin ist 
bevorzugt, da& die erfindungsgemafce S-Layer-Struktur als "VerdOnnungs- 
molekiile" auch nichtmodifizierte S-Layer-Proteine enthait. Die nicht- 
modifizierten S-Layer-Proteine liegen vorzugsweise in einem molaren Anteil 
von 10-99% beziiglich der gesamten S-Layer-Proteine vor. 

Die erfindungsgemalSe S-Layer-Struktur kann mehrere kovalent oder durch 
Affinitatsbindung miteinander verknupfte Schichten umfassen. Kovalente 
Verknupfungen konnen beisptelsweise durch Insertionen von Cysteinresten 
und einer anschliefcenden Ausbtldung von Cystinbrucken eingef tihrt werden . 
Verknupfungen durch Affinitatsbindung umfassen beispielsweise Antikorper- 
Antigen-, Antikorper-Protein A- bzw. -Protein G- oder Streptavidin-Biotin- 
Wechselwirkungen. 

S-Layer-Strukturen, die rekombinante S-Layer-Proteine enthalten, konnen 
gegebenenfalls auch in tragergebundener Form hergestellt werden. Hierzu 
kann die Reassemblierung der S-Layer-Struktur aus einzelnen Einheiten in 
Gegenwart eines PeptidoglycantrSgers erfolgen, wobei beispielsweise 
Peptidogiycanschichten erzeugt werden, die auf einer oder auf beiden Seiten 
mit einer S-Layer-Struktur uberzogen sind. Eine andere Moglichkeit zur 
Herstellung tragergebundener S-Layer-Strukturen besteht darin, eine S- 
Layer-Schicht an iner Grenzflache zwischen zwei Medien, z.B. Wasser/Luft, 
zu erzeugen und diese Schicht auf einer Festphas , z.B. einer Filtermem- 
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bran, zu immobilisieren (vgl. z.B. Pum und SI ytr (1994), Thin Solid Films 
244, 882-886; Kupcu et al. (1995), Biochim. Biophys. Acta 1235, 263- 
269). 

Die rekombinanten S-Layer-Proteine und S-Layer-Strukturen sind fur eine 
Vielzahl von Anwendungen geeignet. Besonders bevorzugt ist die Ver- 
wendung als Vakzin oder Adjuvans, wobei man rekombinante S-Layer- 
Proteine verwendet, die immunogene Epitope von Pathogenen und/oder 
kdrpereigene immunstimulierende Polypeptide, wie etwa Cytokine, 
enthalten. Bei dieser Anwendung ist nicht unbedingt eine Reinigung der 
rekombinanten S-Layer-Proteine erforderlich. Stattdessen kann beispiels- 
weise die Verwendung in Kombination mit einem Bakterienghost erfolgen, 
der ggf. in seinem periplasmatischen Raum, seiner auBeren Membran Oder 
seiner cytoplasmatischen Membran seiner Membran zusatzliche immuno- 
gene Epitope enthalt. 

Die Herstellung geeigneter "Bakterienghosts" ist beispielsweise in der 
internationalen Patentanmeldung PCT/EP9 1/00967 beschrieben, auf die 
hiermit Bezug genommen wird. Dort werden modifizierte Bakterien 
offenbart, erhaltlich durch Transformation eines gram-negativen Bakteriums 
mit dem Gen eines lytisch wirkenden Membranproteins aus Bakteriophagen, 
mit dem Gen eines lytisch wirkenden Toxin-Freisetzungsproteins oder mit 
Genen, die Teilsequenzen davon, die fur lytische Proteine kodieren, 
enthalten, Kultivierung des Bakteriums, Expression dieses Lyse-Gens und 
Isolierung des resultierenden Bakterienghosts aus dem Kulturmedium. 

An die Membran dieser Bakterien kann, wie im europaischen Patent 0 516 
655 beschrieben, ein rekombinantes Protein gebunden sein, das durch 
Expression einer rekombinanten DNA in diesen gram-negativen Bakterien 
erhaltlich ist. Diese rekombinant DNA umfaftt eine erst DNA-Sequenz, 
welche fur eine hydrophobe, nicht lytisch wirkende membranintegrierende 
Proteindomane, die eine er-helikale Struktur besitzt und aus 1 4-20 Amino- 
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sauren besteht, die N- und C-terminal von je 2-30 beli bigen Aminosaur n 
flankiert sein konnen, kodiert. Mit dieser ersten DNA-Sequenz in operativer 
Verknupfung befindet sich eine zweite DNA-Sequenz, die fur ein gevvunsch- 
tes rekombtnantes Protein kodiert. Weiterhin enthait das gram-negative 
Bakterium eine dritte DNA-Sequenz, die unter einer von den ersten und 
zweiten DNA-Sequenzen getrennten Kontrolle steht und fur ein lytisch 
wirkendes Membranprotein aus Bakteriophagen oder ein lytisch wirkendes 
Toxin-Freisetzungsprotein oder fur deren lytisch wirkende Teiie kodiert. 
Durch Expression und Lyse derartiger rekombinanter, gram-negativer 
Bakterien werden sog. "Bakterienghosts" erhalten, die eine intakte 
Oberflachenstruktur mit an die Oberflache gebundenen immunogenen 
Epitopen enthalten. 

Bei Kombination dieser Baktienghosts mit erfindungsgemaRen rekom- 
binanten S-Layern konnen Vakzine und Adjuvantien erzeugt werden, die 
besonders vorteilhafte Eigenschaften aufweisen. 

Eine weitere besonders bevorzugte Verwendung fur rekombinante S-layer- 
Proteine und S-Layer Strukturen ist die Verwendung als Enzymreaktor. Ein 
soicher Enzymreaktor kann beispielsweise von einer Zelle gebildet werden, 
die in ihrem Inneren eine erfindungsgemaRe rekombinante S-Layer-Struktur 
enthait. Andererseits kann der Enzymreaktor auch aus isolierten und in vitro 
reassemblierten S-Layer-Strukturen oder Kombinationen verschiedender S- 
Layer- Strukturen gebildet werden. 

Weiterhin wird die vorliegende Erfindung durch die nachfolgenden Beispiele 
und Figuren erlautert. Es zeigen: 

SEQIDNO.l die vollstandige Nukleotidsequenz des kodierenden 
Abschnitts d s S-Layer-Gens sbsA von B.stearothermo- 
philus; 

SEQ ID NO. 2 die davon abgeleit te Aminosaur sequenz; 
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SEQ ID NO.3 die Nukleotidsequenz des Primers T5-X; 

SEQ ID N0.4 die Nukleotidsequenz des Primers E; 

SEQ ID NO. 5 die vollstandige Nukleotidsequenz des kodierenden 

Abschnitts des S-Layer-Gens sbsB von 

B.stearothermophilus; 
SEQ ID NO. 6 die davon abgeleitete Aminosauresequenz; 
SEQ ID NO. 7 die Signaisequenz des malE Gens; 
SEQ ID NO. 8 die Signaisequenz von Qen3 der Bakteriophagen fd; 
Fig.1 eine schematische Darstellung des zur Hersteilung des 

rekombinanten Vektors pBK4 verwendeten sbsA PCR-Frag- 
ments; 

Fig. 2 eine schematische Darstellung der Hersteilung des das malE- 

sbsA-Fusionsgen enthaltenden Vektors pMAL-A (Beispiel 7), 

Fig. 3 eine schematische Darstellung des Vektors pCant-A (Beispiel 

B), 

Fig.4 die Nukleotidsequenz eines sbsA-Gens fusioniert mit dem 

malE-Gen einschliefclich dessen Signaisequenz, 

Fig. 5 die Nukleotidsequenz eines sbsA-Gens fusioniert mit der 

Signaisequenz von Gen3 des Bakteriophage fd und 

Fig. 6 die Nukleotidsequenz eines sbsB-Gens fusioniert mit dem 

malE-Gen einschliefclich dessen Signaisequenz. 



BE1SP1ELE: 



1 . Bakterienstamme, Medien und Plasmide 

Gram-positive Bakterien des Stammes Bacillus stearothermophilus PV72 
wurden bei 58 °C in SVIII-Medium (Bartelmus und Perschak, Z.Zuckerind.7 
(1 957), 276-281 ) kultiviert. E.coli Bakterien wurden in LB-Medium kultiviert 
(Sambrook et al., (1 989), supra). Zur Selektion von Transformanten wurde 
Ampiciilin in ein r Endkonzentration von 100 j/g/ml dem Medium zu- 
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gegeben. Das Piasmid pPLcATIO WpL, bla, colED (Stanssens et al. f Gen 
36 (1985), 21 1-223) wurde als Klonierungsvektor verwendet. 

2. Manipulation von DNA-Fragmenten 

Restriktionsanaiyse von DNA, Agarosegelelektrophorese und Klonierung von 
DNA-Fragmenten wurden nach den bei Sambrook et al. {19891, supra, 
beschriebenen Standardmethoden durchgefuhrt. 

Die Transformation von kompetenten Zellen erfolgte durch Elektroporation 
unter Verwendung eines Bio-Rad Genepulsers (Bio-Rad Laboratories, 
Richmond, Kalif., USA) nach Protokollen des Herstellers. 

Plasmid-DNA wurde nach der Methode von Birnbotm und Doly (Nucleic 
Acids Res.7 (1 979), 1513-1 523) isoliert. Chromosomale DNA wurde gemafc 
der bei Ausubei et al. (Current Protocols in Molecular Biology (1987), New 
York, John Wiley) beschriebenen Verfahren isoliert. 

Restriktionsendonukleasen und andere Enzyme wurden von Boehringer 
Mannheim, New England Biolabs oder Stratagene bezogen und gemaR den 
Vorschriften der Hersteller eingesetzt. 

3. DNA-Seauenzierung 

Die Sequenzanalyse von DNA-Molektilen erfolgte nach der Didesoxyketten- 
terminationsmethode von Sanger et al.. Die zur Sequenzierung des sbsA- 
Gens verwendeten Primer wurden auf Basis der bereits publizierten sbsA- 
Sequenz (Kuen et at.. Gene 145 (1994), 115-120) konstruiert. 
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4. PCR-Amplifikation von sbsA 

Die PCR-Amplifikation des sbsA-Gens erfolgte in einem Reaktionsvolumen 
von 100 in dem 200 //M Desoxynukleotide, 1U Pfu-Polymerase 
(Stratagene), 1x Pfu-Reaktionspuffer, jeweils 0.5 fjM Oligonukleotidprimer 
und 100 ng genomischer DNA aus B.stearothermophilus als Matrize 
vorhanden waren. Die Amplifikation wurde uber 30 Zyklen in einem 
Thermocycler (Biomed Thermocycler 60) durchgefuhrt. Jeder Zyklus 
bestand aus einem Denaturierungsschritt von 1,5 min bei 95°C, einem 
Annealingschritt von 1 min bei 56°C und 1 min bei 50 °C sowie einem 
Extensionsschritt von 2 min bei 72° C. 

Als Primer wurden der im Sequenzprotokoll als SEQ ID NO. 3 angegebene 
Primer T5-X, der den 5'-Bereich von sbsA flankiert und eine Xbal-Stelle 
enthalt, sowie der im Sequenzprotokoll in SEQ ID NO. 4 gezeigte Primer E 
verwendet, der die 20 Nukleotide stromabwarts gelegene Region des 
Transkriptionsterminatorsder sbsA-Sequenz flankiert und eine BamHI-Steile 
enthalt. 

Die PCR-amplifizierten Produkte wurden auf einem 0.8% Agarosegel 
elektrophoretisch aufgetrennt und zur Klonierung unter Verwendung des 
Systems von Gene Clean (BI0 101 La Jolla, Kalif., USA) zur Klonierung 
gereinigt. 

5. Klonierung des sbsA-Gens in den Vektor pPLcATIO 

Das durch PCR gewonnene sbsA-Gen mit einer Lange von 3,79 kb wurde 
gereinigt und mit den Restriktionsendonukleasen Xbal und BamHl gespalten. 
Das resultierende Xbal-BamHI-Fragment wurd in die entspr chenden 
Restriktionsst Hen des Vektors pPLcATIO kloniert, so dafc das sbsA-G n 
untertranskriptionellerKontrolledesstromaufwartsgelegenenpL-Promotors 
war. Das ATG-Startkodon der sbsA-Sequenz wurde durch die Klonierungs- 
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prozedur rekonstruiert. Die klonierte sbsA-Sequenz enthielt die N-terminale 
Signaisequenz von sbsA und endete 20 nt nach dem Transkriptionstermina- 
tor. Nach Ligation der Vektor-DNA mit dem sbsA-Fragment wurde der 
E.coli-Stamm pop2135 (DSM10509) durch Elektrotransformation trans- 
formiert. Die resultterenden Klone wurden einer DNA-Restriktionsanalyse 
unterzogen. Ein positiver Klon wurde sequenziert, um die korrekten 
Sequenzubergange an den 5'- und 3'-Enden zu verifizieren. Dieser Klon 
wurde als pBK4 bezeichnet. 

Etne schematische Darstellung des 3,79 kb Xbal sbsA-Fragments und seine 
Lokalisierung in der multiplen Klonierungsstelle des Plasmtds pBK4 ist in 
Fig.1 dargesteilt {Abkurzungen: tT: Trans kriptionsterminator; ori: Ursprung 
der DNA-Replikation; amp: Ampicillinresistenzgen). 

6. Rekombinante Expression des sbsA-Gens im Cvt oplasma von E.coli 
(VerQleichsbeispiel) 

E.coli pop2135/pBK4-Zellen wurden bei 28°C bis zum Erreichen einer 
optischen Dichte ODeoo von 0,3 kultiviert. Dann wurde die Expression von 
sbsA durch Erhohung der Kultivierungstemperatur von 28 °C auf 42°C 
induziert. 1,5 ml Aliquots wurden vor bzw. 1, 2, 3 und 5 Stunden nach 
Induktion der sbsA-Expression entnommen. Als Kontrollen wurden E.coli 
pop2135/pPLcAT10 (kultiviert unter den gleichen Bedingungen) und 
B.stearothermophilus PV72 verwendet. 

Kulturuberstande und Zellextrakte aus alien Proben wurden auf die 
Expression des S-Layer-Proteins durch SDS-PAGE und Western-lmmunoblbt- 
ting untersucht. 

Fur den Western Blot wurden die Proteine auf eine Nitrozellulosemembran 
transfer! rt und mit einem polyklonaien Antiserum gegen SbsA aus 
Kaninchen inkubiert. Die Herstellung dieses Antiserums ist bei Egelseer t 
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a). (J. Bacterid. 177 (1995), 1444-1451) beschrieben. Zum Nachweis 
gebundener SbsA-spezifischer Antikorper wurde ein Konjugat aus Ziegen- 
Anti-Kaninchen-IgG und alkalischer Phosphatase verwendet. 

In cytoplasmatischen Extrakten aus mit pBK4 transformierten E.coli-Zellen 
wurde eine zusStzliche starke Proteinbande mit etwa dem gleichen Moleku- 
largewicht wie das Wildtyp-SbsA-Protein gefunden. 

Aus Uberstanden von mit pBK4 transformierten E.colt-Zellen konnte auch 
nach Induktion der sbsA-Gen-Expression kein SbsA-Protein nachgewiesen 
werden. Daraus ist ersichtlich, dafc SbsA nicht in das umgebende Medium 
exportiert wird. 

7. Sekretion des SbsA-Proteins ins Periplasma 

Das sbsA-Gen wurde ohne Signalsequenz und mit Stopkodon am 3'-Ende 
in den Polylinker des kommerziell erhaltlichen Plasmids pMAL-P2 {New 
England Biolabs) kloniert (Fig. 2). Das resultierende Plasmid pMAL-A enthilt 
unter Kontrolle des taq-Pro motors ein Fusionsgen, umfassend das malE-Gen 
einschliefclich dessen Signalsequenz sowie das sbsA-Gen ohne dessen 
Signalsequenz. Zwischen den beiden Domanen ist eine Faktor Xa Spaltungs- 
stelle angeordnet. 

Eine Analyse des Rohextrakts von mit pMAL-A transformierten E.coli DH5a- 
Zellen (Hanahan (1983) supra) zeigte die Expression eines MalE-SbsA 
Fusionspolypeptids mit einem Molekulargewicht von ca. 170 kDa in der 
durch eine kalte osmotische Schockprozedur {Neu und Heppel, J. Biol. 
Chem. 240 (1965); 3685-3692) erzeugten periplasmatischen Fraktion des 
Zellextrakts. Die Nukleotidsequenz des malE-sbsA-Fusionsgens ist in Fig. 4 
dargesteilt. Die malE-Signalsequenz ist in SEQ ID NO. 7 g zeigt. 
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8. Sekretion des SbsA-Proteins in den extrazellularen Raum 

Das Plasmid pCant-A wurde hergestellt durch Klonierung des sbsA-Gens 
ohne eigene Signalsequenz und mit Stopcodon am 3'-Ende in das mit Sfil 
und Notl geschnittenen, kommerziell erhaltlichen Plasmids pCANTAB5E 
(Pharmacia Biotech). Es enthalt unter Kontrolle des lac-Promotors (Plac) die 
Signalsequenz von Gen 3 des Bakteriophagen fd {45 nt) fusioniert mit dem 
sbsA-Gen ohne dessen eigene Signalsequenz (Fig. 3). Die Nukleotidsequenz 
des Fusionsgens ist in Fig. 5 dargestellt. Die fdGen3 Signalsequenz ist in 
SEQ ID NO. 8 gezeigt. 

Im Kulturtiberstand von mit pCant-A transformierten E.coii HB2151 Zellen 
{Pharmacia Biotech) konnte das SbsA-Protein nachgewiesen werden. 

9. Sekretion des SbsB-Proteins in das Periolasma und in den e xtrazellularen 

Raum 

Das sbsB-Gen wurde - wie in den Beispielen 7 und 8 beschrieben - ohne 
eigene Signalsequenz in die Plasmide pMAL-P2 und pCANTAB5E kloniert, 
wobei die Plasmide pMAL-B und pCant-B erhalten wurden. 

In mit den Plasmiden pMAL-B und pCant-B transformierten E.coli-Zellen 
konnte eine Sekretion des SbsB-Proteins in das Periplasma und in den 
extrazellularen Raum gezeigt werden. 
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SEQUENZPROTOKOLL 

(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: Werner Lubitz 

(B) STRASSE: Schoenborngasse 12/7 

(C) ORT: Wien 

(E) LAND: Austria 

(F) POSTLEITZAHL: 1080 

(ii) BEZEICHNUNG DER ERFINDUNG: Sekretion von S- 

Layer-Proteinen in 
das Periplasma und in 

den extrazellularen 

Raum 

(iii) ANZAHL DER SEQUENZEN : 6 

(iv) COMPUTER - LES BARE FAS SUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBS SYSTEM: PC -DOS /MS -DOS 

(D) SOFTWARE: Patentln Release #1.0, Version 

#1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 3687 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vi) URS PRUNGLI CHE HERKUNFT: 

(A) ORGANISMUS: Bacillus stearotherraophilus 

(B) STAMM: PV72 



(vii) UNM I TTELBARE HERKUNFT : 
(B) CLON(E) : sbsA 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..3684 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: sigjpeptide 

(B) LAGE:1..90 
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(ix) MERKMAL: 

(A) NAME / SCHLUS SEL : mat_peptide 

(B) LAGE: 91 . . 3684 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 1: 

ATG GAT AGG AAA, AAA GCT GTG AAA CTA GCA ACA GCA AGT GCT ATT GCA 48 
Met Asp Arg Lys Lys Ala val Lya Leu Ala Thr Ala Ser Ala lie Ala 
10 -30 -25 -20 -15 

GCA AGT GCA TTT GTC GCT GCA AAT CCA AAC GCT TCT GAA GCG GCT ACA 96 
Ala Ser Ala Phe Val Ala Ala Asn Pro Asn Ala Ser Glu Ala Ala Thr 
-10 -5 1 

1 5 GAT GTA GCA ACA GTA GTA AGC CAA GCA AAA GCA CAG TTC AAA AAA GCA 144 
asd Val Ala Thr Val Val Ser Gin Ala Lys Ala Gin Phe Lys Lys Ala 
5 10 15 

20 TAC TAT ACT TAC AGC CAT ACA GTA ACG GAA ACT GGT GAA TTC CCA AAC 192 
Tyr Tyr Thr Tyr Ser His Thr Val Thr Glu Thr Gly Glu Phe Pro Asn 
20 25 30 

ATT AAC GAT GTA TAT GCT GAA TAC AAC AAA GCG AAA AAA CGA TAC CGT 240 
25 He Asn Asp val Tyr Ala Glu Tyr Asn Lys Ala Lys Lys Arg Tyr Arg 

35 40 45 50 

GAT GCG GTA GCA TTA GTG AAT AAA GCA GGT GGC GCG AAA AAA GAC GCT 288 
Asp Ala Val Ala Leu Val Asn Lys Ala Gly Gly Ala Lys Lys Asp Ala 
30 55 60 65 

TAC TTA GCT GAT TTA CAA AAA GAA TAT GAA ACT TAC GTT TTC AAA GCA 336 
Tyr Leu Ala Asp Leu Gin Lys Glu Tyr Glu Thr Tyr val Phe Lys Ala 
70 75 80 

35 

AAC CCT AAA TCT GGC GAA GCT CGT GTA GCA ACT TAC ATC GAT GCT TAC 384 
Asn Pro Lys Ser Gly Glu Ala Arg Val Ala Thr Tyr He Asp Ala Tyr 
85 90 95 

40 AAC TAT GCA ACA AAA TTA GAC GAA ATG CGC CAA GAG CTA GAG GCT GCT 432 
Asn Tyr Ala Thr Lys Leu Asp Glu Met Arg Gin Glu Leu Glu Ala Ala 
100 105 110 

GTT CAA GCA AAA GAT TTA GAA AAA GCA GAA CAA TAC TAT CAC AAA ATT 480 
45 Val Gin Ala Lya Asp Leu Glu Lys Ala Glu Gin Tyr Tyr His Lya He 
115 120 125 130 

CCT TAT GAA ATT AAA ACT CGC ACA GTC ATT TTA GAT CGC GTA TAT GGT 528 
Pro Tyr Glu He Lys Thr Arg Thr Val He Leu Asp Arg Val Tyr Gly 
50 135 140 145 

AAA ACA ACT CGT GAT TTA CTT CGC TCT ACA TTT AAA GCA AAA GCA CAA 576 
Lys Thr Thr Arg Asp Leu Leu Arg Ser Thr Phe Lys Ala Lys Ala Gin 
150 155 160 

55 

GAA CTT CGC GAC AGC TTA ATT TAT GAT ATT ACC GTT GCA ATG AAA GCG 624 
Glu Leu Arg Asp Ser Leu He Tyr Asp He Thr Val Ala Met Lys Ala 
165 170 175 

60 CGC GAA GTA CAA GAC GCT GTG AAA GCA GGC AAT TTA GAC AAA GCT AAA 672 

Arg Glu Val Gin Asp Ala Val Lys Ala Gly Asn Leu Asp LyB Ala Lys 
190 185 190 

GCT GCT GTT GAT CAA ATC AAT CAA TAC TTA CCA AAA GTA ACA GAT GCT 720 
65 Ala Ala Val Asp Gin He Asn Gin Tyr Leu Pro Lys Val Thr Asp Ala 
195 " 200 205 210 

TTC AAA ACT GAA CTA ACA GAA GTA GCG AAA AAA GCA TTA GAT GCA GAT 768 
Phe Lys Thr Glu Leu Thr Glu Val Ala Lys Lys Ala Leu Asp Ala Asp 
70 215 220 225 
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GAA GCT GCG CTT ACT CCA AAA GTT GAA AGT GTA AGT GCQ ATT AAC ACT 
Glu Ala Ala Leu Thr Pro Lys Val Glu Ser Val Ser Ala lie Asn Thr 
230 235 240 

CAA AAC AAA GCT GTT GAA TTA ACA GCA GTA CCA GTG AAC GGA ACA CTA 
Gin Asn Lys Ala Val Glu Leu Thr Ala Val Pro Val Asn Gly Thr Leu 
245 250 255 

AAA TTA CAA CTT TCA GCT GCT GCA AAT GAA GAT ACA GTA AAC GTA AAT 
Lys Leu Gin Leu Ser Ala Ala Ala Asn Glu Asp Thr Val Asn Val Asn 
260 265 270 

ACT GTA CGT ATC TAT AAA GTG GAC GGT AAC ATT CCA TTT GCC CTT AAT 
Thr val Arg lie Tyr Lys Val Asp Gly Asn He Pro Phe Ala Leu Asn 
275 280 285 290 

ACG GCA GAT GTT TCT TTA TCT ACA GAC GGA AAA ACT ATC ACT GTG GAT 
Thr Ala Asp Val Ser Leu Ser Thr Asp Gly Lys Thr lie Thr Val Asp 
295 300 305 

GCT TCA ACT CCA TTC GAA AAT AAT ACG GAG TAT AAA GTA GTA GTT AAA 
Ala Sec Thr Pro Phe Glu Asn Asn Thr Glu Tyr Lys val Val Val Lys 
310 315 320 

GGT ATT AAA GAC AAA AAT GGC AAA GAA TTT AAA GAA GAT GCA TTC ACT 
Gly He Lys Asp Lys Asn Gly Lys Glu Phe Lys Glu Asp Ala Phe Thr 
32S 330 335 

TTC AAG CTT CGA AAT GAT GCT GTA GTT ACT CAA GTG TTT GGA ACT AAT 
Phe Lys Leu Arg Asn Asp Ala Val Val Thr Gin Val Phe Gly Thr Asn 
340 345 350 

GTA ACA AAC AAC ACT TCT GTA AAC TTA GCA GCA GGT ACT TTC GAC ACT 

Val Thr Asn Asn Thr Ser Val Asn Leu Ala Ala Gly Thr Phe Asp Thr 
355 360 365 370 

GAC GAT ACT TTA ACA GTA GTA TTT GAT AAG TTG TTA GCA CCT GAA ACT 
Aap Asp Thr Leu Thr Val Val Phe Asp Lys Leu Leu Ala Pro Glu Thr 
37S 380 385 

GTA AAC AGC TCG AAC GTT ACT ATT ACA GAT GTT GAA ACT GGA AAA CGC 
Val Asn Ser Ser Asn Val Thr lie Thr Asp Val Glu Thr Gly Lys Arg 
390 395 400 

ATT CCA GTA ATT GCA TCT ACT TCT GGT TCT ACA ATT ACT ATT ACG TTA 
lie Pro Val He Ala Ser Thr Ser Gly Ser Thr He Thr He Thr Leu 
405 410 415 

AAA GAA GCG TTA GTA ACT GGT AAA CAA TAT AAA CTT GCT ATC AAT AAT 
Lys Glu Ala Leu Val Thr Gly Lys Gin Tyr Lys Leu Ala He Asn Asn 
420 425 430 

GTT AAA ACA TTA ACT GGT TAC AAT GCA GAA GCT TAC GAG TTA GTG TTC 
Val Lys Thr Leu Thr Gly Tyr Asn Ala Glu Ala Tyr Glu Leu Val Phe 

435 440 445 450 

ACT GCA AAC GCA TCA GCA CCA ACT GTT GCT ACC GCT CCT ACT ACT TTA 
Thr Ala Asn Ala Ser Ala Pro Thr Val Ala Thr Ala Pro Thr Thr Leu 
455 460 465 

GGT GGT ACA ACT TTA TCT ACT GGT TCT CTT ACA ACA AAT GTT TGG GGT 
Gly Gly Thr Thr Leu Ser Thr Gly Ser Leu Thr Thr Asn Val Trp Gly 
470 475 480 

AAA TTG GCT GGT GGT GTG AAT GAA GCT GGA ACT TAT TAT CCT GGT CTT 
Lys Leu Ala Gly Gly Val Asn Glu Ala Gly Thr Tyr Tyr Pro Gly Leu 

485 490 495 

CAA TTC ACA ACA ACG TTT GCT ACT AAG TTA GAC GAA TCT ACT TTA GCT 
Gin Phe Thr Thr Thr Phe Ala Thr Lys Leu Asp Glu Ser Thr Leu Ala 
500 505 510 
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GAT AAC TTT GTA TTA GTT GAA AAA GAA TCT GGT ACA GTT GTT GCT TCT 
Asp Asn Phe Val Leu Val Glu Lya Glu Ser Gly Thr Val Val Ala Ser 
515 520 525 530 

GAA CTA AAA TAT AAT GCA GAC GCT AAA ATG GTA ACT TTA GTG CCA AAA 
Glu Leu Lye Tyr Asn Ala Asp Ala Lys Met Val Thr Leu Val Pro Lys 
S35 540 545 

GCG GAC CTT AAA GAA AAT ACA ATC TAT CAA ATC AAA ATT AAA AAA GGC 
Ala Asp Leu Lys Glu Asn Thr lie Tyr Gin lie Lys He Lys Lys Gly 
550 555 560 

TTG AAG TCC GAT AAA GGT ATT GAA TTA GGC ACT GTT AAC GAG AAA ACA 
Leu Lys Ser Asp Lys Gly He Glu Leu Gly Thr Val Asn Glu Lys Thr 
565 570 575 

TAT GAG TTC AAA ACT CAA GAC TTA ACT GCT CCT ACA GTT ATT AGC GTA 
Tyr Glu Phe Lys Thr Gin Asp Leu Thr Ala Pro Thr Val He Ser Val 
580 5BS 590 

ACG TCT AAA AAT GGC GAC GCT GGA TTA AAA GTA ACT GAA GCT CAA GAA 

Thr Ser Lys Asn Gly Asp Ala Gly Leu Lys Val Thr Glu Ala Gin Glu 

595 ' 600 605 610 

TTT ACT GTG AAG TTC TCA GAG AAT TTA AAT ACA TTT AAT GCT ACA ACC 
Phe Thr Val Lys Phe Ser Glu Asn Leu Asn Thr Phe Asn Ala Thr Thr 
615 620 625 

GTT TCG GGT AGC ACA ATC ACA TAC GGT CAA GTT GCT GTA GTA AAA GCG 

Val Ser Gly ser Thr lie Thr Tyr Gly Gin Val Ala Val val Lys Ala 

630 635 640 

GGT GCA AAC TTA TCT GCT CTT ACA GCA AGT GAC ATC ATT CCA GCT ACT 
Gly Ala Asn Leu Ser Ala Leu Thr Ala Ser Asp lie He Pro Ala Ser 
. 645 650 655 

GTT GAA GCG GTT ACT GGT CAA GAT GGA ACA TAC AAA GTG AAA GTT GCT 
Val Glu Ala Val Thr Gly Gin Asp Gly Thr Tyr Lys Val Lys Val Ala 
660 665 670 

GCT AAC CAA TTA GAA CGT AAC CAA GGG TAC AAA TTA GTA GTG TTC GGT 

Ala Asn Gin Leu Glu Arg Asn Gin Gly Tyr Lys Leu val Val Phe Gly 
675 680 685 690 

AAA GGT GCA ACA GCT CCT GTT AAA GAT GCT GCA AAT GCA AAT ACT TTA 
Lys Gly Ala Thr Ala Pro Val Lys Asp Ala Ala Asn Ala Asn Thr Leu 
695 700 705 

GCA ACT AAC TAT ATC TAT ACA TTT ACA ACT GAA GGT CAA GAC GTA ACA 
Ala Thr Asn Tyr He Tyr Thr Phe Thr Thr Glu Gly Gin Asp Val Thr 
710 715 720 

GCA CCA ACG GTT ACA AAA GTA TTC AAA GGT GAT TCT TTA AAA GAC GCT 

Ala Pro Thr Val Thr Lys Val Phe Lys Gly Asp Ser Leu Lys Asp Ala 
725 730 735 

GAT GCA GTT ACT ACA CTT ACG AAC GTT GAT GCA GGT CAA AAA TTC ACT 
Asp Ala Val Thr Thr Leu Thr Asn Val Asp Ala Gly Gin Lya Phe Thr 
740 74S 750 

ATC CAA TTT AGC GAA GAA TTA AAA ACT TCT AGT GGT TCT TTA GTG GGT 
He Gin Phe Ser Glu Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gly 
755 760 765 770 

GGC AAA GTA ACT GTC GAG AAA TTA ACA AAC AAC GGA TGG GTA GAT OCT 
Gly Lys Val Thr Val Glu Lys Leu Thr Asn Asn Gly Trp Val Asp Ala 
775 780 785 

GGT ACT GGA ACA ACT GTA TCA GTT GCT CCT AAG ACA GAT GCA AAT GGT 
Gly Thr Gly Thr Thr val Ser val Ala Pro Lys Thr Asp Ala Asn Gly 
790 795 800 
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AAA GTA ACA GCT GCT GTG GTT ACA TTA ACT GGT CTT GAC AAT AAC GAC 

Lys Val Thr Ala Ala val Val Thr Leu Thr Gly Leu Aep Asn Asn Asp 
805 810 815 

AAA GAT GCG AAA TTG CGT CTG GTA GTA GAT AAG TCT TCT ACT GAT GGA 
Lys Asp Ala Lys Leu Arg Leu Val Val Asp Lys Ser Ser Thr Asp Gly 
820 825 830 

ATT GCT GAT GTA GCT GGT AAT GTA ATT AAG GAA AAA GAT ATT TTA ATT 
lie Ala Asp Val Ala Gly Asn Val He Lys Glu Lys Asp He Leu He 
835 840 845 850 

CGT TAC AAC AGC TGG AGA CAC ACT GTA GCT TCT GTG AAA GCT GCT GCT 
Arq Tyr Asn Ser Trp Arg His Thr Val Ala Ser Val Lys Ala Ala Ala 
855 860 865 

GAC AAA GAT GGT CAA AAC GCT TCT GCT GCA TTC CCA ACA AGC ACT GCA 
asp Lys Asp Gly Gin Asn Ala Ser Ala Ala Phe Pro Thr Ser Thr Ala 

* 870 B75 880 

ATT GAT ACA ACT AAG AGC TTA TTA GTT GAA TTC AAT GAA ACT GAT TTA 
He Asp Thr Thr Lys Ser Leu Leu Val Glu Phe Asn Glu Thr Asp Leu 
885 890 895 

GCG GAA GTT AAA CCT GAG AAC ATC GTT GTT AAA GAT GCA GCA GGT AAT 
Ala Glu Val Lys Pro Glu Asn He Val Val Lys Asp Ala Ala Gly Asn 
900 90S 910 

GCG GTA GCT GGT ACT GTA ACA GCA TTA GAC GGT TCT ACA AAT AAA TTT 

Ala Val Ala Gly Thr Val Thr Ala Leu Asp Gly Ser Thr Asn Lys Phe 

915 920 925 930 

GTA TTC ACT CCA TCT CAA GAA TTA AAA GCT GGT ACA GTT TAC TCT GTA 
Val Phe Thr Pro Ser Gin Glu Leu Lys Ala Gly Thr Val Tyr Ser Val 
935 940 945 

ACA ATT GAC GGT GTG AGA GAT AAA GTA GGT AAC ACA ATC TCT AAA TAC 
Thr He Asp Gly Val Arg Asp Lys Val Gly Asn Thr He Ser Lys Tyr 
950 955 960 

ATT ACT TCG TTC AAG ACT GTA TCT GCG AAT CCA ACG TTA TCT TCA ATC 
He Thr Ser Phe Lys Thr Val Ser Ala Asn Pro Thr Leu Ser Ser He 
965 970 975 

AGC ATT GCT GAC GGT GCA GTT AAC GTT GAC CGT TCT AAA ACA ATT ACA 
Ser He Ala Asp Gly Ala Val Asn Val Asp Arg Ser Lys Thr He Thr 
9B0 985 990 

ATT GAA TTC AGC GAT TCA GTT CCA AAC CCA ACA ATC ACT CTT AAG AAG 

He Glu Phe Ser Asp Ser Val Pro Asn Pro Thr He Thr Leu Lys Lys 
995 1000 1005 1010 

GCT GAC GGA ACT TCA TTT ACT AAT TAC ACT TTA GTA AAT GTA AAT AAT 
Ala Asp Gly Thr Ser Phe Thr Asn Tyr Thr Leu Val Asn Val Asn Asn 
1015 1020 1025 

GAA AAT AAA ACA TAC AAA ATT GTA TTC CAC AAA GGT GTA ACA CTT GAC 
Glu Asn Lys Thr Tyr Lys He Val Phe His Lys Gly Val Thr Leu Asp 
1030 1035 1040 

GAG TTT ACT CAA TAT GAG TTA GCA GTT TCA AAA GAT TTT CAA ACT GGT 
Glu Phe Thr Gin Tyr Glu Leu Ala Val Ser Lys Asp Phe Gin Thr Gly 
1045 1050 105S 

ACT GAT ATT GAT AGC AAA GTT ACA TTC ATC ACA GGT TCT GTT GCT ACT 
Thr Asp He Asp Ser Lys Val Thr Phe lie Thr Gly Ser val Ala Thr 
1060 1065 1070 

GAC GAA GTA AAA CCT GCT CTA GTA GGC GTT GGT TCA TGG AAT GGA ACA 
Asp Glu Val Lys Pro Ala Leu val Gly val Gly ser Trp Asn Gly Thr 
1075 1080 1085 1090 
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AGC TAT ACT CAG GAT GCT GCA GCA ACA CGA CTT CGG TCT GTA GCT GAC 34 OB 

Ser Tyr Thr Gin Asp Ala Ala Ala Thr Arg Leu Arg Ser Val Ala Asp 
1095 1100 1105 

TTC GTT GCG GAG CCA GTT GCC CTT CAA TTC TCA GAA GGT ATC GAT TTA 3456 
Phe Val Ala Glu Pro Val Ala Leu Gin Phe ser Glu Gly lie Asp Leu 
1110 1115 1120 

ACG AAT GCA ACT GTG ACA GTA ACA AAT ATT ACT GAT GAT AAA ACT GTT 3504 
Thr Asn Ala Thr Val Thr Val Thr Asn He Thr Asp Asp Lys Thr Val 
1125 1130 1135 

GAA GTT ATT TCA AAA GAG AGT GTA GAC GCA GAC CAT GAT GCA GGT GCT 3552 
Glu Val He Ser Lys Glu Ser Val Asp Ala Asp His Aep Ala Gly Ala 
1140 1145 1150 

ACT AAG GAG ACA TTA GTA ATT AAC ACA GTT ACT CCT TTA GTA CTT GAT 3600 
Thr Lys Glu Thr Leu Val He Asn Thr Val Thr Pro Leu Val Leu Asp 
1155 H60 1165 1170 

AAC AGC AAG ACT TAT AAG ATT GTT GTA AGT GGA GTT AAA GAT GCA GCA 3648 
Asn Ser Lys Thr Tyr Lys He Val Val Ser Gly Val Lys Asp Ala Ala 
1175 1180 1185 

GGT AAT GTT GCA GAT ACT ATT ACA TTC TAT ATT AAG TAA 3687 
Gly Asn Val Ala Asp Thr He Thr Phe Tyr He Lys 
1190 1195 



30 



(2) ANGABEN ZU SEQ ID NO : 2: 



35 



(1) SEQUENZKENNZEICHEN: 

(A) LANGE: 1228 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 2: 

Met Asp Arg Lys Lys Ala Val Lys Leu Ala Thr Ala Ser Ala lie Ala 
-30 -25 -20 "15 

Ala Ser Ala Phe Val Ala Ala Asn Pro Asn Ala Ser Glu Ala Ala Thr 
-10 -5 1 

Asp Val Ala Thr Val Val Ser Gin Ala Lys Ala Gin Phe Lye Lys Ala 
5 10 15 

Tyr Tyr Thr Tyr Ser His Thr Val Thr Glu Thr Gly Glu Phe Pro Asn 
20 25 30 

He Asn Asp Val Tyr Ala Glu Tyr Asn Lys Ala Lys Lys Arg Tyr Arg 
35 40 45 50 

Asp Ala Val Ala Leu Val Asn Lys Ala Gly Gly Ala Lys Lys Asp Ala 
55 60 65 

Tyr Leu Ala Asp Leu Gin Lys Glu Tyr Glu Thr Tyr Val Phe Lys Ala 
70 75 80 

Asn Pro Lys Ser Gly Glu Ala Arg Val Ala Thr Tyr He Asp Ala Tyr 
85 90 95 

Aan Tyr Ala Thr Lys Leu Asp Glu Met Arg Gin Glu Leu Glu Ala Ala 
100 105 110 
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Val Gin Ala Lys Asp Leu Glu Lys Ala Glu Gin Tyr Tyr His Lys lie 
115 120 125 130 

Pro Tyr Glu He Lys Thr Arg Thr Val He Leu Asp Arg Val Tyr Gly 
135 140 145 

Lys Thr Thr Arg Asp Leu Leu Arg Ser Thr Phe Lya Ala Lys Ala Gin 
ISO 155 160 

Glu Leu Arg Asp Ser Leu He Tyr Asp lie Thr Val Ala Met Lys Ala 
165 170 175 

Arg Glu Val Gin Asp Ala Val Lys Ala Gly Asn Leu Asp Lys Ala Lys 
180 185 190 

Ala Ala Val Asp Gin He Asn Gin Tyr Leu Pro Lys Val Thr Asp Ala 
195 200 205 210 

Phe Lys Thr Glu Leu Thr Glu Val Ala Lys Lys Ala Leu Asp Ala Asp 
215 220 225 

Glu Ala Ala Leu Thr Pro Lys Val Glu Ser Val Ser Ala He Asn Thr 
230 235 240 

Gin Asn Lys Ala Val Glu Leu Thr Ala Val Pro Val Asn Gly Thr Leu 
245 250 255 

Lys Leu Gin Leu Ser Ala Ala Ala Asn Glu Asp Thr Val Asn Val Asn 
260 265 270 

Thr Val Arg He Tyr Lys Val Asp Gly Asn He Pro Phe Ala Leu Asn 
275 2B0 285 290 

Thr Ala Asp Val Ser Leu Ser Thr Asp Gly Lys Thr He Thr Val Asp 
295 300 305 

Ala Ser Thr Pro Phe Glu Asn Asn Thr Glu Tyr Lys Val Val Val Lys 
310 31S 320 

Gly He Lys Asp Lys Asn Gly Lys Glu Phe Lys Glu Asp Ala Phe Thr 
325 330 335 

Phe Lys Leu Arg Asn Asp Ala Val Val Thr Gin Val Phe Gly Thr Asn 
340 345 350 

Val Thr Asn Asn Thr Ser Val Asn Leu Ala Ala Gly Thr Phe Asp Thr 
355 360 365 370 

asp Asp Thr Leu Thr Val Val Phe Asp Lys Leu Leu Ala Pro Glu Thr 
* 375 380 385 

Val Asn Ser Ser Asn Val Thr He Thr Asp Val Glu Thr Gly Lys Arg 
390 395 400 

He Pro Val He Ala Ser Thr Ser Gly Ser Thr He Thr He Thr Leu 
405 410 415 

Lys Glu Ala Leu Val Thr Gly Lys Gin Tyr Lys Leu Ala He Asn Asn 
420 425 430 

Val Lys Thr Leu Thr Gly Tyr Aan Ala Glu Ala Tyr Glu Leu Val Phe 
435 440 445 450 

Thr Ala Asn Ala Ser Ala Pro Thr Val Ala Thr Ala Pro Thr Thr Leu 
455 460 465 



WO 99/06567 PCT/EP98/04723 



-31 - 

Gly Gly Thr Thr Leu Ser Thr Gly Ser Leu Thr Thr Asn Val Trp Gly 
470 475 480 

Lys Leu Ala Gly Gly Val Asn Glu Ala Gly Thr Tyr Tyr Pro Gly Leu 
485 490 495 

Gin Phe Thr Thr Thr Phe Ala Thr Lys Leu Asp Glu Ser Thr Leu Ala 
500 505 510 

Asp Asn Phe Val Leu Val Glu Lys Glu Ser Gly Thr Val Val Ala Ser 
515 520 525 530 

Glu Leu Lys Tyr Asn Ala Asp Ala Lys Met Val Thr Leu Val Pro Lys 
535 540 545 

Ala Asp Leu Lys Glu Asn Thr He Tyr Gin He Lys lie Lys Lys Gly 
550 555 560 

Leu Lys Ser Asp Lys Gly He Glu Leu Gly Thr Val Asn Glu Lys Thr 
565 570 575 

Tyr Glu Phe Lys Thr Gin Asp Leu Thr Ala Pro Thr Val He Ser Val 
580 585 590 

Thr Ser Lys Asn Gly Asp Ala Gly Leu Lys Val Thr Glu Ala Gin Glu 
595 ' 600 605 610 

Phe Thr Val Lys Phe Ser Glu Asn Leu Asa Thr Phe Asn Ala Thr Thr 
615 620 625 

Val Ser Gly Ser Thr He Thr Tyr Gly Gin Val Ala Val Val Lys Ala 
630 635 640 

Gly Ala Asn Leu Ser Ala Leu Thr Ala Ser Asp lie lie Pro Ala Ser 
645 650 655 

Val Glu Ala Val Thr Gly Gin Asp Gly Thr Tyr Lys Val Lys Val Ala 
660 665 670 

Ala Asn Gin Leu Glu Arg Asn Gin Gly Tyr Lys Leu Val Val Phe Gly 
675 680 685 690 

Lys Gly Ala Thr Ala Pro Val Lys Asp Ala Ala Asn Ala Asn Thr Leu 
695 700 705 

Ala Thr Asn Tyr He Tyr Thr Phe Thr Thr Glu Gly Gin Asp Val Thr 
710 715 720 

Ala Pro Thr Val Thr Lys Val Phe Lys Gly Asp Ser Leu Lys Asp Ala 
725 730 735 

Asp Ala Val Thr Thr Leu Thr Asn Val Asp Ala Gly Gin Lys Phe Thr 
740 745 750 

He Gin Phe Ser Glu Glu Leu Lys Thr Ser Ser Gly Ser Leu Val Gly 
755 760 765 770 

Gly Lys Val Thr Val Glu Lys Leu Thr Asn Asn Gly Trp Val Asp Ala 
775 780 785 

Gly Thr Gly Thr Thr Val Ser Val Ala Pro Lys Thr Asp Ala Asn Gly 
790 795 800 

Lys Val Thr Ala Ala Val Val Thr Leu Thr Gly Leu Asp Asn Asn Asp 
805 810 BIS 
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Lys Asp Ala Lys Leu Arg Leu Val Val Asp Ly9 Ser Ser Thr Asp Gly 
820 825 830 

He Ala Asp Val Ala Gly Asn Val lie Lys Glu Lys Asp He Leu He 
835 840 845 850 

Arg Tyr Asn Ser Trp Arg His Thr Val Ala Ser Val Lys Ala Ala Ala 
855 860 865 

Asp Lys Asp Gly Gin Asn Ala Ser Ala Ala Phe Pro Thr Ser Thr Ala 
870 B75 880 

He Asp Thr Thr Lys Ser Leu Leu Val Glu Phe Asn Glu Thr Asp Leu 
885 890 895 

Ala Glu Val Lys Pro Glu Asn He Val Val Lys Asp Ala Ala Gly Asn 
900 905 910 

Ala Val Ala Gly Thr Val Thr Ala Leu Asp Gly Ser Thr Asn Lys Phe 
915 920 925 930 

Val Phe Thr Pro Ser Gin Glu Leu Lys Ala Gly Thr Val Tyr Ser Val 
935 940 945 

Thr He Asp Gly Val Arg Asp Lys Val Gly Asn Thr He Ser Lys Tyr 
950 955 960 

He Thr Ser Phe Lys Thr Val Ser Ala Asn Pro Thr Leu Ser Ser He 
965 970 975 

Ser He Ala Asp Gly Ala Val Asn Val ABp Arg Ser Lys Thr He Thr 
980 98S 990 

He Glu Phe Ser Asp Ser Val Pro Asn Pro Thr He Thr Leu Lys Lys 
995 1000 1005 1010 

Ala Asp Gly Thr Ser Phe Thr Asn Tyr Thr Leu Val Asn Val Asn Asn 
1015 1020 1025 

Glu Asn Lys Thr Tyr Lys He Val Phe His Lys Gly Val Thr Leu Asp 
1030 1035 1040 

Glu Phe Thr Gin Tyr Glu Leu Ala Val Ser Lys Asp Phe Gin Thr Gly 
1045 1050 1055 

Thr Asp He Asp Ser Lys Val Thr Phe He Thr Gly Ser Val Ala Thr 
1060 1065 1070 

Asp Glu Val Lys Pro Ala Leu Val Gly Val Gly Ser Trp Asn Gly Thr 
1075 " 1080 1065 1090 

Ser Tyr Thr Gin Asp Ala Ala Ala Thr Arg Leu Arg Ser Val Ala Asp 
1095 1100 H05 

Phe Val Ala Glu Pro Val Ala Leu Gin Phe Ser Glu Gly He Asp Leu 
1110 1115 1120 

Thr Asn Ala Thr val Thr Val Thr Asn He Thr Asp Asp Lys Thr Val 
1125 1130 1135 

Glu Val He Ser Lys Glu Ser Val Asp Ala Asp His Asp Ala Gly Ala 
1140 1145 1150 

Thr Lys Glu Thr Leu Val He Asn Thr Val Thr Pro Leu Val Leu Asp 
1155 1160 1165 1170 



WO 99/06567 



PCT/EP98/04723 



- 33 - 

Asn Ser Lys Thr Tyr Lys lie Val Val Ser Gly Val Lys Asp Ala Ala 
1175 1180 1185 

Gly Asn Val Ala Asp Thr He Thr Phe Tyr He Lys 
1190 H95 



(2) ANGABEN ZU SEQ ID NO: 3: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 33 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

TTAATCGATT CTAGATGGAT AGGAAAAAAG CJQ 



(2) ANGABEN ZU SEQ ID NO: 4: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 3 7 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

ATACCCGGGG GTACGGATCC GATACAGATT TGAGCAA 

(2) ANGABEN ZU SEQ ID NO: 5: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 2766 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vi) URS PRUNGLI CHE HERKUNFT: 

(A) ORGANISMUS: Bacillus stearothermophilus 
<B) STAMM: PV72 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : sbsB 



to 



15 



50 
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(ix) MERKMAL: 

(A) NAME / SCHLUS SEL : CDS 

(B) LAGE:1. .2763 



;ix) MERKMAL: 

(A) NAME /SCHLUS SEL : sig_peptide 

(B) LAGE : 1 . . 93 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: raat_peptide 

(B) LAGE: 94. .2763 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 5: 
ATG GCT TAT CAA CCT AAG TCT TTT CGC AAG TTT GTT GCG ACA ACT GCA 4B 

20 Met Ala Tyr Gin Pro Lys Ser Phe Arg Lys Phe Val Ala Thr Thr Ala 
-31 -30 -25 -20 

ACA GCT GCC ATT GTA GCA TCT GCG GTA GCT CCT GTA GTA TCT GCA GCA 96 
Thr Ala Ala He Val Ala Ser Ala Val Ala Pro Val Val Ser Ala Ala 
25 -15 -10 -5 1 

AGC TTC ACA GAT GTT GCG CCG CAA TAT AAA GAT GCG ATC GAT TTC TTA 144 
Ser Phe Thr Asp Val Ala Pro Gin Tyr Lys Asp Ala He Asp Phe Leu 
5 10 15 

30 

GTA TCA ACT GGT GCA ACA AAA GGT AAA ACA GAA ACA AAA TTC GGC GTT 192 
Val Ser Thr Gly Ala Thr Lys Gly Lys Thr Glu Thr Lys Phe Gly Val 
20 25 30 

35 TAC GAT GAA ATC ACT CGT CTA GAT GCG GCA GTT ATT CTT GCA AGA GTA 240 
Tyr Asp Glu He Thr Arg Leu Asp Ala Ala Val He Leu Ala Arg Val 
35 40 45 

TTA AAA CTA GAC GTT GAC AAC GCA AAA GAC GCA GGC TTC ACA GAT GTG 268 
40 Leu Lys Leu Asp Val Asp Asn Ala Lys Asp Ala Gly Phe Thr Asp val 

50 * 55 60 65 

CCA AAA GAC CGT GCA AAA TAC GTC AAC GCG CTT GTA GAA GCT GGC GTA 336 
Pro Lys Asp Arg Ala Lys Tyr Val Asn Ala Leu Val Glu Ala Gly Val 
45 70 75 80 

TTA AAC GGT AAA GCA CCT GGC AAA TTT GGT GCA TAC GAC CCA TTA ACT 384 
Leu Asn Gly Lys Ala Pro Gly Lys Phe Gly Ala Tyr Asp Pro Leu Thr 
85 90 95 



CGC GTT GAA ATG GCA AAA ATC ATC GCG AAC CGT TAC AAA TTA AAA GCT 432 
Arg Val Glu Met Ala Lys He He Ala Asn Arg Tyr Lys Leu Lys Ala 
100 105 HO 



55 GAC GAT GTA AAA CTT CCA TTC ACT GAT GTA AAC GAT ACA TGG GCA CCA 480 
Asp Asp Val Lys Leu Pro Phe Thr Asp Val Asn Asp Thr Trp Ala Pro 
115 120 125 

TAC GTA AAA GCG CTT TAT AAA TAC GAA GTA ACC AAA AGO TTA AAA CAC 528 
60 Tyr Val Lys Ala Leu Tyr Lys Tyr Glu Val Thr Lys Arg Leu Lys His 

130 135 140 145 

CAA CAA GCT TCG GTG CAT ACC AAA AAC ATC ACT CTG CGT GAC TTT GCG 576 
Gin Gin Ala Ser Val His Thr Lys Asn He Thr Leu Arg Asp Phe Ala 
65 150 155 160 



CAA TTT GTA TAT AGA GCG GTG AAT ATT AAT GCA GTG CCA GAA ATA GTT 
Gin Phe Val Tyr Arg Ala Val Asn He Asn Ala Val Pro Glu He Val 
165 170 175 



624 
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GAA GTA ACT GCG GTT AAT TCG ACT ACA GTG AAA GTA ACA TIC AAT ACG 
Glu Val Thr Ala Val Asn Ser Thr Thr Val Lys Val Thr Phe Asn Thr 
180 185 190 

CAA ATT GCT GAT GTT GAT TTC ACA AAT TTT GCT ATC GAT AAC GGT TTA 
Gin He Ala Asp Val Asp Phe Thr Asn Phe Ala He Asp Asn Gly lieu 
195 200 205 

ACT GTT ACT AAA GCA ACT CTT TCT CGT GAT AAA AAA TCC GTA GAG GTT 
The Val Thr Lys Ala Thr Leu Ser Arg Asp Lys Lys Ser Val Glu Val 
210 215 220 225 

GTG GTA AAT AAA CCG TTT ACT CGT AAT CAG GAA TAT ACA ATT ACA GCG 
Val Val Asn Lya Pro Phe Thr Arg Asn Gin Glu Tyr Thr He Thr Ala 
230 235 240 

ACA GGC ATT AAA AAT TTA AAA GGC GAG ACC GCT AAG GAA TTA ACT GGT 
Thr Gly He Lys Asn Leu Lys Gly Glu Thr Ala Lys Glu Leu Thr Gly 
245 250 255 

AAG TTT GTT TGG TCT GTT CAA GAT GCG GTA ACT GTT GCA CTA AAT AAT 
Lys Phe Val Trp Ser Val Gin Asp Ala Val Thr Val Ala Leu Asn Asn 
260 265 270 

AGT TCG CTT AAA GTT GGA GAG GAA TCT GGT TTA ACT GTA AAA GAT CAG 
Ser Ser Leu Lys Val Gly Glu Glu Ser Gly Leu Thr Val Lys Asp Gin 
275 280 285 



305 



GAT GGC AAA GAT GTT GTA GGT GCT AAA GTA GAA CTT ACT TCT TCT AAT 

Asp Gly Lys Asp Val val Gly Ala Lys Val Glu Leu Thr ser ser Asn 
290 295 300 3C 

ACT AAT ATT GTT GTA GTT TCA AGT GGC GAA GTA TCA GTA TCT GCT GCT 
Thr Asn He Val Val Val Ser Ser Gly Glu Val Ser Val Ser Ala Ala 
310 315 320 

AAA GTT ACA GCT GTA AAA CCG GGA ACA GCT GAT GTT ACT GCA AAA GTT 
Lys Val Thr Ala Val Lys Pro Gly Thr Ala Asp Val Thr Ala Lys Val 
325 330 335 

ACA TTA CCA GAT GGT GTT GTA CTA ACA AAT ACA TTT AAA GTG ACA GTT 
Thr Leu Pro Asp Gly Val Val Leu Thr Asn Thr Phe Lys Val Thr Val 
340 345 350 

ACA GAA GTG CCT GTT CAA GTC CAA AAT CAA GGA TTT ACT TTA GTT GAT 
Thr Glu Val Pro Val Gin Val Gin Asn Gin Gly Phe Thr Leu Val Asp 
355 360 365 

AAT CTT TCT AAT GCT CCA CAG AAT ACA GTT GCA TTT AAC AAA GCT GAG 
Asn Leu Ser Asn Ala Pro Gin Asn Thr Val Ala Phe Asn Lys Ala Glu 
370 375 380 385 

AAA GTA ACT TCA ATG TTT GCT GGA GAA ACT AAA ACA GTT GCA ATG TAT 
Lys Val Thr Ser Met Phe Ala Gly Glu Thr Lys Thr Val Ala Met Tyr 
390 395 400 

GAT ACT AAA AAC GGT GAT CCT GAA ACT AAA CCT GTT GAT TTC AAA GAT 
Asp Thr Lys Asn Gly Asp Pro Glu Thr Lys Pro Val Asp Phe Lys Asp 

405 410 415 

GCA ACT GTA CGT TCA TTA AAT CCA ATT ATT GCA ACA GCT GCT ATT AAT 
Ala Thr Val Arg Ser Leu Asn Pro Ha He Ala Thr Ala Ala He Asn 
420 425 430 

GGT AGT GAG CTC CTT GTC ACA GCT AAT GCT GGC CAA TCT GGA AAA GCT 
Gly Ser Glu Leu Leu Val Thr Ala Asn Ala Gly Gin Ser Gly Lys Ala 

435 440 445 

TCA TTT GAA GTA ACA TTA AAA GAT AAT ACA AAA AGA ACA TTT ACA GTT 
Ser Phe Glu Val Thr Leu Lys Asp Asn Thr Lys Arg Thr Phe Thr Val 
450 455 460 465 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 
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1440 



1488 
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GAT GTA AAA AAA GAC CCT GTA TTA CAA GAT ATA AAA GTA GAT GCA ACT 
Asp Val Lye Lya Asp Pro Val Leu Gin Asp lie Lys Val Asp Ala Thr 
470 475 480 

TCT GTT AAA CTT TCC GAT GAA GCT GTT GGC GGC GGG GAA GTT GAA GGA 
Ser Val Lys Leu Ser Asp Glu Ala Val Gly Gly Gly Glu Val Glu Gly 
485 490 495 

GTT AAC CAA AAA ACG ATT AAA GTA AGT GCA GTT GAC CAA TAC GGT AAA 
Val Asn Gin Lys Thr He Lys Val Ser Ala Val Asp Gin Tyr Gly Lys 
500 505 510 

GAA ATT AAA TTT GGT ACA AAA GGT AAA GTT ACT GTT ACA ACT AAT ACA 
Glu He Lys Phe Gly Thr Lys Gly Lye Val Thr Val Thr Thr Asn Thr 
515 520 525 

GAA GGA CTA GTT ATT AAA AAT GTA AAT AGC GAT AAT ACA ATT GAC TTT 
Glu Gly Leu Val He Lys A6n Val Asn Ser Asp Asn Thr lie Asp Phe 
530 535 540 545 

GAT AGC GGC AAT AGT GCA ACT GAC CAA TTT GTT GTC GTT GCA ACA AAA 
Asp Ser Gly Asn Ser Ala Thr Aap Gin Phe Val Val Val Ala Thr Lya 
SSO 555 560 

GAC AAA ATT GTC AAT GGT AAA GTA GAA GTT AAA TAT TTC AAA AAT GCT 
Asp Lys lie val Asn Gly Lys Val Glu Val Lys Tyr Phe Lys Asn Ala 
565 570 575 

AGT GAC ACA ACA CCA ACT TCA ACT AAA ACA ATT ACT GTT AAT GTA GTA 
Ser Asp Thr Thr Pro Thr Ser Thr Lys Thr He Thr Val Asn Val Val 
560 5B5 590 

AAT GTA AAA GCT GAC GCT ACA CCA GTA GGA TTA GAT ATT GTA GCA CCT 

Asn val Lys Ala Asp Ala Thr pro val Gly Leu Asp He Val Ala Pro 
595 ' 600 605 

TCT AAA ATT GAT GTA AAT GCT CCA AAC ACT GCT TCT ACT GCA GAT GTT 
Ser Lys He Asp Val Asn Ala Pro Asn Thr Ala Ser Thr Ala Asp Val 
610 615 620 625 

GAT TTT ATA AAT TTC GAA AGT GTT GAG ATT TAC ACA CTC GAT TCA AAT 
Asp Phe He Asn Phe Glu ser Val Glu He Tyr Thr Leu Asp Ser Asn 
630 635 640 

GGT AGA CGT CAA AAA AAA GTT ACT CCA ACT GCA ACT ACA CTT GTA GGT 
Glv Arq Arg Gin Lys Lys Val Thr Pro Thr Ala Thr Thr Leu Val Gly 
645 650 655 

ACA AAA AAA AAA AAA AAA GTT AAT GGG AAT GTA TTA CAA TTC AAG GGG 
Thr Lys Lys Lys Lys Lys Val Asn Gly Asn Val Leu Gin Phe Lys Gly 
660 665 670 

AAC GAA GAA TTA ACG CTA TCA ACT TCT TCT AGT ACA GGA AAC GTA GAT 
Asn Glu Glu Leu Thr Leu Ser Thr Ser Ser Ser Thr Gly Asn Val Asp 
675 680 5B5 

GGA ACA GCA GAA GGA ATG ACA AAA CGT ATT CCA GGG AAA TAT ATC AAC 
Gly Thr Ala Glu Gly Met Thr Lys Arg He Pro Gly Lys Tyr He Asn 
690 695 700 705 

TCT GCA AGT GTA CCT GCC AGT GCA ACA GTA GCA ACA AGT CCT GTT ACT 
Ser Ala Ser Val Pro Ala Ser Ala Thr Val Ala Thr Ser Pro Val Thr 
710 715 720 

GTA AAG CTT AAT TCA AGT GAT AAT GAT TTA ACA TTT GAA GAA TTA ATA 
Val Lys Leu Asn Ser Ser Asp Asn Asp Leu Thr Phe Glu Glu Leu He 
725 730 735 

TTC GGT GTA ATT GAC CCT ACA CAA TTA GTC AAA GAT GAA GAC ATC AAC 

Phe Gly Val He Asp Pro Thr Gin Leu Val Lys Asp Glu Asp He Asn 

740 745 750 



1536 
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GAA TTT ATT GCA GTT TCA AAA GCG GCT AAA AAT GAT GGA TAT TTG TAT 
Glu Phe He Ala Val Ser Lys Ala Ala Lys Asn Asp Gly Tyr Leu Tyr 
755 760 765 

AAT AAA CCG CTT GTA ACG GTT AAA GAT GCA TCA GGA AAA GTT ATT CCA 
Asn Lys Pro Leu Val Thr Val Lys Asp Ala Ser Gly Lys Val He Pro 

770 775 780 "85 

ACA GGT GCA AAT GTT TAC GGT CTA AAT CAT GAT GCA ACT AAC GGA AAC 
Thr Gly Ala Asn Val Tyr Gly Leu Asn His Asp Ala Thr Asn Gly Asn 
790 795 800 

ATT TGG TTT GAT GAG GAA CAA GCT GGC TTA GCT AAA AAA TTT AGT GAT 

He Trp Phe Asp Glu Glu Gin Ala Gly Leu Ala Lys Lys Phe Ser Asp 
805 810 815 

GTA CAT TTT GAT GTT GAT TTT TCA TTA ACT AAC GTT GTA AAA ACT GGT 
Val His Phe Asp Val Asp Phe Ser Leu Thr Asn val Val Lys Thr Gly 
820 825 830 

AGC GGT ACA GTT TCT TCA TCG CCA TCA TTA TCT GAC GCA ATT CAA CTT 
Ser Gly Thr Val Ser Ser Ser Pro Ser Leu Ser Asp Ala He Gin Leu 
B35 8*0 845 

ACT AAT TCA GGC GAT GCA GTA TCG TTT ACA TTA GTT ATC AAA TCA ATT 
Thr Asn Ser Gly Asp Ala Val Ser Phe Thr Leu Val He Lys Ser He 
850 * 855 BSO 865 

TAT GTT AAA GGC GCA GAT AAA GAT GAT AAT AAC TTA CTT GCA GCC CCT 
Tvr Val Lys Gly Ala Asp Lys Asp Asp Asn Asn Leu Leu Ala Ala Pro 
* 870 875 880 

GTT TCT GTC AAT GTG ACT GTG ACA AAA TAA 
Val Ser Val Asn val Thr Val Thr Lys 
885 890 



2400 



2448 



2496 



2544 



2592 



2640 



2688 



2736 



2766 



40 



45 



(2) ANGABEN ZU SEQ ID NO: 6: 



( i ) SEQUENZKENNZEI CHEN : 

(A) LANGE: 921 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS: Protein 



50 



55 



60 



65 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Ala Tyr Gin Pro Lys Ser Phe Arg Lys Phe val Ala Thr Thr Ala 
-31 -30 -25 -20 

Thr Ala Ala He Val Ala Ser Ala val Ala Pro Val Val Ser Ala Ala 
-15 -10 -5 1 

Ser Phe Thr Asp Val Ala Pro Gin Tyr Lys Asp Ala He Asp Phe Leu 
5 10 15 

val Ser Thr Gly Ala Thr Lys Gly Lys Thr Glu Thr Lya Phe Gly Val 

20 25 30 

Tyr Asp Glu He Thr Arg Leu Asp Ala Ala Val He Leu Ala Arg Val 
35 40 45 

Leu Lys Leu Asp Val Asp Asn Ala Lys Asp Ala Gly Phe Thr Asp Val 

50 55 60 65 



70 
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Pro Lys Asp Arg Ala Lys Tyr Val Asn Ala Leu Val Glu Ala Gly Val 
70 75 80 

Leu Asn Gly Lys Ala Pro Gly Lys Phe Gly Ala Tyr Asp Pro Leu Thr 
85 90 95 

Arg Val Glu Mec Ala Lys lie He Ala Asn Arg Tyr Lys Leu Lys Ala 
100 105 HO 

Asp Asp val Lys Leu Pro Phe Thr Asp Val Asn Asp Thr Trp Ala Pro 
115 120 125 

Tyr val Lys Ala Leu Tyr Lys Tyr Glu Val Thr Lys Arg Leu Lya His 
130 135 140 145 

Gin Gin Ala Ser Val His Thr Lys Asn He Thr Leu Arg Asp Phe Ala 
150 155 160 

Gin Phe Val Tyr Arg Ala Val Asn He Asn Ala Val Pro Glu He Val 
165 170 175 

Glu Val Thr Ala Val Asn Ser Thr Thr Val Lys Val Thr Phe Asn Thr 
180 185 190 

Gin He Ala Asp Val Asp Phe Thr Asn Phe Ala He Asp Asn Gly Leu 
195 200 205 

Thr Val Thr Lys Ala Thr Leu Ser Arg Asp Lys Lys Ser Val Glu Val 
210 215 220 225 

Val Val Asn Lys Pro Phe Thr Arg Asn Gin Glu Tyr Thr He Thr Ala 
230 235 240 

Thr Glv He Lys Asn Leu Lys Gly Glu Thr Ala Lys Glu Leu Thr Gly 
245 250 255 

Lys Phe Val Trp Ser Val Gin Asp Ala Val Thr Val Ala Leu Asn Asn 
260 265 270 

Ser Ser Leu Lys Val Gly Glu Glu Ser Gly Leu Thr Val Lys Asp Gin 
275 280 285 

Asp Gly LyB Asp Val Val Gly Ala Lys Val Glu Leu Thr Ser Ser Asn 
290 295 300 305 

Thr Asn He Val Val Val Ser Ser Gly Glu Val Ser val Ser Ala Ala 
310 315 320 

Lye val Thr Ala Val Lys Pro Gly Thr Ala Asp Val Thr Ala Lys Val 
325 330 335 

Thr Leu Pro Asp Gly Val Val Leu Thr Asn Thr Phe Lys Val Thr Val 
340 345 350 

Thr Glu Val Pro Val Gin Val Gin ABn Gin Gly Phe Thr Leu Val Asp 
355 360 365 

Asn Leu Ser Asn Ala Pro Gin Asn Thr Val Ala Phe Asn Lys Ala Glu 
370 375 380 385 

Lys val Thr Ser Mec Phe Ala Gly Glu Thr Lys Thr Val Ala Met Tyr 

390 395 400 

Asp Thr Lys Asn Gly Asp Pro Glu Thr Lys Pro Val Asp Phe Lys Asp 

405 410 415 

Ala Thr Val Arg Ser Leu ABn Pro He He Ala Thr Ala Ala He Asn 
420 425 430 

Gly Ser Glu Leu Leu Val Thr Ala Asn Ala Gly Gin Ser Gly Lys Ala 

435 440 445 

Ser phe Glu Val Thr Leu Lys Abp Asn Thr Lys Arg Thr Phe Thr Val 
450 455 460 465 
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Asp Val Lys Lys Asp Pro Val Leu Gin Asp He Lys Val Asp Ala Thr 
470 475 480 

Ser Val Lys Leu Ser Asp Glu Ala Val Gly Gly Gly Glu Val Glu Gly 
5 485 490 495 

val Asn Gin Lys Thr lie Lys Val Ser Ala Val Asp Gin Tyr Gly Lys 
500 505 510 

10 Glu He Lys Phe Gly Thr Lys Gly Lys Val Thr Val Thr Thr Asn Thr 
515 520 525 



15 



25 



40 



55 



70 



Glu Gly Leu Val He Lys Asn Val Asn Ser Asp Asn Thr He Asp Phe 
530 535 540 545 

Asp Ser Gly Asn Ser Ala Thr Asp Gin Phe Val Val Val Ala Thr Lys 
550 555 560 



20 Asp Lys He Val Asn Gly Lys Val Glu Val Lys Tyr Phe Lys Asn Ala 
565 570 575 



Ser Asp Thr Thr Pro Thr Ser Thr Lys Thr He Thr Val Asn val Val 
580 585 590 

Asn val Lys Ala Asp Ala Thr Pro Val Gly Leu Asp He Val Ala Pro 
595 600 60S 



Ser Lys He Asp Val Asn Ala Pro Asn Thr Ala Ser Thr Ala Asp Val 
30 610 615 620 625 

Asp Phe He Asn Phe Glu Ser Val Glu He Tyr Thr Leu Asp Ser Asn 
630 635 640 

35 Gly Arg Arg Gin Lys Lys Val Thr Pro Thr Ala Thr Thr Leu Val Gly 
645 650 655 



Thr Lys Lys Lys Lys Lys Val Asn Gly Asn Val Leu Gin Phe Lys Gly 
660 665 670 

Asn Glu Glu Leu Thr Leu Ser Thr Ser Ser Ser Thr Gly Asn Val Asp 
675 680 685 



Gly Thr Ala Glu Gly Met Thr Lys Arg He Pro Gly Lys Tyr He Asn 
45 690 695 700 705 

Ser Ala Ser Val Pro Ala Ser Ala Thr Val Ala Thr Ser Pro Val Thr 
710 715 720 

50 Val Lys Leu Asn Ser Ser Asp Asn Asp Leu Thr Phe Glu Glu Leu He 
725 730 735 



Phe Gly Val He Asp Pro Thr Gin Leu Val Lys Asp Glu Asp He Asn 
740 745 750 

Glu Phe He Ala Val Ser Lys Ala Ala Lys Asn Asp Gly Tyr Leu Tyr 
755 760 765 



Asn Lys Pro Leu Val Thr Val Lya Asp Ala Ser Gly Lys Val He Pro 
60 770 775 780 785 

Thr Gly Ala Asn Val Tyr Gly Leu Asn His Asp Ala Thr Asn Gly Asn 
790 795 BOO 

65 He Trp Phe Asp Glu Glu Gin Ala Gly Leu Ala Lys Lys Phe Ser Asp 
80S 810 B15 



val His Phe Asp Val Asp Phe Ser Leu Thr Asn Val Val Lys Thr Gly 
620 825 830 

Ser Gly Thr Val Ser Ser Ser Pro Ser Leu Ser Asp Ala He Gin Leu 
835 840 845 
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Thr Asn Ser Gly Asp Ala val Ser Phe Thr Leu Val He Lys Ser He 
850 855 860 86 

Tvr Val Lys Gly Ala Asp Lys Asp Asp Aan Asn Leu Leu Ala Ala Pro 
870 875 980 

Val Ser Val Asn Val Thr Val Thr Lys 
885 890 



10 

(2) ANGABEN ZU SEQ ID NO : 7: 



(i) SEQUENZKENNZEICHEN: 
15 (A) LANGE: 75 Baaenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



20 



25 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7 

ATGAAAATAA AAACAGGTGC ACGCATCCTC GCATTATCCG CATTAACGAC 
GATGATGTTT TCCGCCTCGG CTCTC 



(2) ANGABEN ZU SEQ ID NO: 8: 



( i ) SEQUENZKENNZEI CHEN : 

(A) LANGE: 45 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

GTGAAAAAAT TATTATTCGC AATTCCTTTA 
40 GTTGTTCCTT TCTAT 



-41 - 



Anspriiche 

Verfahren zur Herstellung von S-Layer-Proteinen, 
dadurch gekennzeichnet, 
dafc man 

(a) eine gram-negative prokaryontische Wirtszelle bereitstellt, 
die transformiert ist mit einer fur ein S-Layer-Protein kodie- 
renden Nukleinsaure in operativer Verknupfung mit einer 
Signaisequenz, die fur ein Peptid kodiert, das eine integra- 
tion des S-Layer-Proteins in der aufceren Membran der Wirts- 
zelle, eine Integration des S-layer-Proteins in der cytoplas- 
matischen Membran der Wirtszelle, eine Sekretion des S- 
Layer- Proteins in den periplasmatischen Raum der Wirtszelle 
oder/und eine Sekretion in das die Wirtszelle umgebende 
Medium bewirkt, 

(b) die Wirtszelle unter solchen Bedingungen kultiviert, die zu 
einer Expression der Nukleinsaure und zu einer Erzeugung 
des davon kodierten Polypeptids fuhren und 

{c) gegebenenfalls das resultierende Polypeptid aus der Mufceren 
Membran der Wirtszelle, aus der cytoplasmatischen Mem- 
bran der Wirtszelle, aus dem periplasmatischen Raum der 
Wirtszelle oder/und aus dem die Wirtszelle umgebenden 
Medium gewinnt. 

Verfahren zur Herstellung von S-Layer-Proteinen, 
dadurch gekennzeichnet, 
daB man 

(a) ine eukaryontisch Wirtszelle b reitstellt, die transformiert 
ist mit ein r fur in S-Layer-Protein k dierend n Nuklein- 
saure vorzugsweise in operativer Verknupfung mit einer 
Signaisequenz, die eine Int gration des S-Lay r-Proteins in 
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der cytoplasmatischen Membran der Wirtszelle, eine Integra- 
tion des S-Layer-Proteins in einer Organelle der Wirtszelle 
oder/und eine Sekretion in das die Wirtszelle umgebende 
Medium bewirkt, 

(b) die Wirtszelle unter solchen Bedingungen kultiviert, die zu 
einer Expression der Nukleinsaure und zu einer Erzeugung 
des da von kodierten Polypeptids fiihren und 

(c) gegebenenfalls das resultierende Polypeptid a us der cyto- 
plasmatischen Membran der Wirtszelle, einer Organelle der 
Wirtszelle oder/und aus dem die Wirtszelle umgebenden 
Medium gewinnt. 

3. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

dafc man eine E.coli-Wirtszelle verwendet. 

4. Verfahren nach Anspruch 2, 
dadurch gekennzeichnet, 

daft man eine Insekten-, Sauger- oder Hefezelle verwendet. 

5. Verfahren nach einem der vorhergehenden AnsprGche, 
dadurch gekennzeichnet, 

da& die NukleinsSure, die fur ein S-Layer-Protein kodiert, ausge- 
wahlt wird aus 

(i) einer Nukleinsaure, welche die von Position 91 bis 3684 in 
SEQ ID No.1 gezeigte Nukleotidsequenz umfaBt, 

(ii) einer Nukleinsaure, welche eine der Nukleinsaure aus (i) im 
Rahmen der Degeneration des genetischen Codes entspre- 
chende Nukleotidsequenz umfa&t, und 
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(iii) ein r Nukleinsaure, welche eine mit den Nukleinsauren aus 
(i) oder/und (ii) unter stringenten Bedingungen hybridisie- 
rende Nukleotidsequenz umfafct. 

Verfahren nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, 

da& die Nukleinsaure, die fur ein S-Layer-Protein kodiert, ausge- 
w§hlt wird aus 

(i) einer Nukleinsaure, welche die von Position 94 bis 2763 in 
SEQ ID No. 5 gezeigte Nukleotidsequenz umfafit, 

(ii) einer Nukleinsaure, welche eine der Nukleinsaure aus (i) im 
Rahmen der Degeneration des genetischen Codes entspre- 
chenden Nukleotidsequenz umfafct und 

(iii) einer Nukleinsaure, welche eine mit den Nukleinsauren aus 
(i) oder/und (ii) unter stringenten Bedingungen hybridisie- 
rende Nukleotidsequenz umfa&t. 

Verfahren nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet 

da& die fur das S-Layer- Protein kodierende Nukleinsaure eine Oder 
mehrere Insertionen enthalt, die fur heterologe Peptid- oder Poly- 
peptidsequenzen kodieren. 

Verfahren nach Anspruch 7, 
dadurch gekennzeichnet, 

daft die Insertionsstelle an Position 562, 585, 881, 920, 1087, 
1813, 1947, 2295, 2652, 3046, 3484 oder/und 3594 der in SEQ 
ID No. 1 gezeigten Nukleotidsequenz lokalisiert ist. 
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9. Verfahren nach Anspruch 7, 
dadurch gekennzeichnet, 

daS die Insertionsstelle an Position 410, 484, 598, 1012, 1435, 
1583, 1808 oder/und 2301 der in SEQ ID No. 5 gazeigten Nukleo- 
tidsequenz lokalisiert ist. 

10. Verfahren nach einem der Anspruche 7 bis 9, 
dadurch gekennzeichnet, 

daft die Insertionen ausgewahlt werden aus Nukleotidsequenzen, 
die fQr Cysteinreste, Bereiche mit mehreren geladenen Aminosau- 
ren oder Tyr-Resten, DNA-bindende Epitope, metalibindende 
Epitope, immunogene Epitope, allergene Epitope, antigene Epitope, 
Streptavidin, Enzyme, Cytokine oder Antikdrper-bindende Proteine 
kodieren. 

1 1 . Verfahren nach Anspruch 1 0, 
dadurch gekennzeichnet, 

daft die insertionen fur Streptavidin kodieren. 

12. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

da& die Insertionen fur immunogene Epitope aus Herpesviren, 
insbesondere Herpesvirus 1 oder 6, FMDV, Raviviren oder Filovi- 
ren kodieren. 

13. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

daR die Insertionen fur Enzyme, wie etwa Polyhydroxybuttersaure- 
synthase oder bakterielle Lucif erase, kodieren. 
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14. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

daS die Insertionen fur Cytokine, wie etwa Interleukine, Interferone 
oder Tumornekrosefaktoren, kodieren. 

15. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

daft die Insertionen fur Antikdrper-bindende Proteine, wie etwa 
Protein A oder Protein G, kodieren. 

16. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

dad die Insertionen fur antigene Epitope kodieren, die an Cytokine 
oder Endotoxine binden. 

17. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

daB die Insertionen fur metallbindende Epitope kodieren. 

18. Verfahren nach Anspruch 10, 
dadurch gekennzeichnet, 

daft die Insertionen ausgewahlt werden aus Nukleotidsequenzen, 
die fur Cysteinreste kodieren. 

19. Verfahren nach einem der Anspruche 1 bis 18, 
dadurch gekennzeichnet, 

daS 5'-seitig der fur das S-Layer-Protein kodierenden NukleinsSure 
in operativer Verknupfung eine Nukleinsaure angeordnet ist, die fur 
ein Signalpeptid aus gram-negativen prokaryontischen Zellen 
kodiert. 



WO 99/06567 



PCT/EP98/04723 



-46 - 

20. Verfahren nach Anspruch 19, 
dadurch gekennzeichnet, 

da& die fur das Signalpeptid kodierende Nukleinsaure 

(a) den Signalpeptid-kodierenden Abschnitt der in SEQ ID No. 7 
oder 8 dargestellten Nukleotidsequenz, 

(b) eine der Sequenz aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder/- 
und 

(c) eine zu den Sequenzen aus (a) oder/und (b) mindestens 
80% homoioge Nukleotidsequenz umfafct. 

21. Verfahren nach einem der Anspruche 1 bis 18, 
dadurch gekennzeichnet. 

da& 5'-seitig der fur das S-Layer-Protein kodierenden Nukleinsaure 
in operativer VerknOpfung eine Nukleinsaure angeordnet ist, die fur 
ein Signalpeptid aus eukaryontischen Zellen kodiert. 

22. Verfahren nach einem der Anspruche 1 bis 21, 
dadurch gekennzeichnet, 

daR in der Wirtszelle mindestens zwei S-Layer-Gene exprimiert 
werden, wobei eines davon fur ein modifiziertes S-Layer-Protein 
und ein anderes fur ein nichtmodifiziertes S-Layer-Protein kodiert. 

23. Verfahren nach Anspruch 22, 
dadurch gekennzeichnet, 

da& das modifizierte S-Layer-Protein in der Lage ist, eine mit dem 
nichtmodifizierten S-Layer-Protein kompatible S-Layer-Struktur 
auszubilden. 
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24. Nukleinsaure, 

dadurch gekennzeichnet, 

dafi sie fur ein gegebenenfalls heteroioge Peptid- oder Polypeptid- 
insertionen enthaltendes S-Layer-Protein kodiert und in operativer 
Verknupfung mit einer Signalsequenz ist, die fur ein Peptid kodiert, 
das 

(a) eine Integration in die aufcere Membran einer gramnegativen 
prokaryontischen Wirtszelle, eine Integration in die cytoplas- 
matische Membran einer gram-negativen prokaryontischen 
Wirtszelle, eine Sekretion des S-Layer- Proteins in den peri- 
plasmatischen Raum einer gram-negativen prokaryontischen 
Wirtszelle oder/und eine Sekretion in das extrazellulare 
Medium einer gram-negativen prokaryontischen Wirtszelle 
oder 

(b) eine Integration in die cytoplasmatische Membran einer 
eukaryontischen Wirtszelle, eine Integration in eine Orga- 
nelle einer eukaryontischen Wirtszelle oder/und eine Sekre- 
tion in das extrazellulare Medium einer eukaryontischen 
Wirtszelle bewirkt. 

25. Vektor, 

dadurch gekennzeichnet, 

dafc er mindestens eine Kopie einer Nukleinsaure nach Anspruch 
23 enthalt. 

26. Gram-negative prokaryontische oder eukaryontische Zelle, 
dadurch gekennzeichnet, 

daft sie mit einer Nukleinsaure nach Anspruch 24 oder einem 
Vektor nach Anspruch 25 transformiert ist. 
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27. ZeH nach Anspruch 26, 
dadurch gekennzeichnet, 

daB sie eine E.coli-Zelle 1st. 

28. Prokaryontische Zelle nach Anspruch 26 oder 27, 
dadurch gekennzeichnet, 

da(S sie eine S-Layer-Struktur im periplasmatischen Raum oder/und 
verankert in der cytopiasmatischen Membran enthalt. 

29. Zelle nach Anspruch 26, 
dadurch gekennzeichnet, 

dafc sie eine Sauger-, Insekten- oder/und Hefezelle ist. 

30. Eukaryontische Zelie nach Anspruch 26 oder 29, 
dadurch gekennzeichnet, 

daft sie eine S-Layer-Struktur verankert in der cytopiasmatischen 
Mernbran oder/und integriert in eine Orangelle der Zelle enthalt. 
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Figur 1 
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Fortsetzung Figur 2 
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Figur 3 
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Figur 4 

Nukleotidsequenz eines SbsA-Gens fusioniert mit dera MalE-Gen 
einschliefelich dessen Signal sequenz (4988bp) . 

Klonierung: MalE aus pMal-p2 mit SbsA (ohne ss) in BamHI von MCS 
Merlcmale: 

Position 1249 bis 1254: BamHI -Schnittstelle 

Position 4956 bis 4961: BamHI -Sennit tst el le 

Position 1255 bis 4851: SbsA-Gen ohne eigene Signalsequenz 

Start MalE-Gen mit Signalsequenz 

ATGAAAATAA AAACAGGTGC ACGCATCCTC GCATTATCCG CATTAACGAC GATGATGTTT 60 

TCCGCCTCGG CTCTCGCCAA AATCGAAGAA GGTAAACTGG TAATCTGGAT TAACGGCGAT 120 

AAAGGCTATA ACGGTCTCGC TGAAGTCGGT AAGAAATTCG AGAAAGATAC CGGAATTAAA 180 

GTCACCGTTG AGCATCCGGA TAAACTGGAA GAGAAATTCC CACAGGTTGC GGCAACTGGC 240 

GATGGCCCTG ACATTATCTT CTGGGCACAC GACCGCTTTG GTGGCTACGC TCAATCTGGC 300 

CTGTTGGCTG AAATCACCCC GGACAAAGCG TTCCAGGACA AGCTGTATCC GTTTACCTGG 360 

GATGCCGTAC GTTACAACGG CAAGCTGATT GCTTACCCGA TCGCTGTTGA AGCGTTATCG 420 

CTGATTTATA ACAAAGATCT GCTGCCGAAC CCGCCAAAAA CCTGGGAAGA GATCCCGGCG 480 

CTGGATAAAG AACTGAAAGC GAAAGGTAAG AGCGCGCTGA TGTTCAACCT GCAAGAACCG 540 

TACTTCACCT GGCCGCTGAT TGCTGCTGAC GGGGGTTATG CGTTCAAGTA TGAAAACGGC 600 

AAGTACGACA TTAAAGACGT GGGCGTGGAT AACGCTGGCG CGAAAGCGGG TCTGACCTTC 660 

CTGGTTGACC TGATTAAAAA CAAACACATG AATGCAGACA CCGATTACTC CATCGCAGAA 720 

GCTGCCTTTA ATAAAGGCGA AACAGCGATG ACCATCAACG GCCCGTGGGC ATGGTCCAAC 780 

ATCGACACCA GCAAATTGAA TTATGGTGTA ACGGTACTGC CGACCTTCAA GGGTCACCCA 840 

TCCAAACCGT TCGTTGGCGT GCTGAGCGCA GGTATTAACG CCGCCAGTCC GAACAAAGAG 900 

TTGGCGAAAG AGTTCCTCGA AAACTATCTG CTGACTGATG AAGGTCTGGA AGCGGTTAAT 960 

AAAGACAAAC CGCTGGGTGC CGTAGCGCTG AAGTCTTACG AGGAAGAGTT GGCGAAAGAT 1020 

CCACGTATTG CCGCCACCAT GGAAAACGCC CAGAAAGGTG AAATCATGCC GAACATCCCG 1080 

CAGATGTCCG CTTTCTGGTA TGCCGTGCGT ACTGCGGTGA TCAACGCCGC CAGCGGTCGT 1140 

CAGATCGTCG ATGAAGCCCT GAAAGACGCG CAGACTAATT CGAGCTCGAA CAACAACAAC 1200 

BamHI /Start SbsA 

AATAACAATA ACAACAACCT CGGGATCGAG GGAAGGATTT CAGAATT CGG ATCCG CTACA 1260 

GATGTAGCAA CAGTAGTAAG CCAAGCAAAA GCACAGTTCA AAAAAGCATA CTATACTTAC 1320 

AGCCATACAG TAACGGAAAC TGGTGAATTC CCAAACATTA ACGATGTATA TGCTGAATAC 1380 
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Fortsetzung Pigur 4 










AACAAAGCGA 


AAAAACGATA 


CCGTGATGCG 


GTAGCATTAG 


TGAATAAAGC AGGTGGCGCG 


1440 


AAAAAAGACG 


CTTACTTAGC 


TGATTTACAA 


AAAGAATATG 


AAACTTACGT TTTCAAAGCA 


1500 


AACCCTAAAT 


CTGGCGAAGC 


TCGTGTAGCA 


ACTTACATCG 


ATGCTTACAA CTATGCAACA 


1560 


AAATTAGACG 


AAATGCGCCA 


AGAGCTAGAG 


GCTGCTGTTC 


AAGCAAAAGA TTTAGAAAAA 


1620 


GCAGAACAAT 


ACTATCACAA 


AATTCCTTAT 


GAAATTAAAA 


CTCGCACAGT CATTTTAGAT 


1680 


CGCGTATATG 


GTAAAACAAC 


TCGTGATTTA 


CTTCGCTCTA 


CATTTAAAGC AAAAGCACAA 


1740 


GAACTTCGCG 


ACAGCTTAAT 


TTATGATATT 


ACCGTTGCAA 


TGAAAGCGCG CGAAGTACAA 


1800 


GACGCTGTGA 


AAGCAGGCAA 


TTTAGACAAA 


GCTAAAGCTG 


CTGTTGATCA AATCAATCAA 


1860 


TACTTACCAA 


AAGTAACAGA 


TGCTTTCAAA 


ACTGAACTAA 


CAGAAGTAGC GAAAAAAGCA 


1920 


TTAGATGCAG 


ATGAAGCTGC 


GCTTACTCCA 


AAAGTTGAAA 


GTGTAAGTGC GATTAACACT 


1980 


CAAAACAAAG 


CTGTTGAATT 


AACAGCAGTA 


CCAGTGAACG 


GAACACTAAA ATTACAACTT 


2040 


TCAGCTGCTG 


CAAATGAAGA TACAGTAAAC 


GTAAATACTG 


TACGTATCTA TAAAGTGGAC 


2100 


GGTAACATTC 


CATTTGCCCT 


TAATACGGCA GATGTTTCTT 


TATCTACAGA CGGAAAAACT 


2160 


ATCACTGTGG 


ATGC TTCAAC 


TCCATTCGAA 


AATAATACGG 


AGTATAAAGT AGTAGTTAAA 


2220 


GGTATTAAAG 


ACAAAAATGG 


CAAAGAATTT 


AAAGAAGATG 


CATTCACTTT CAAGCTTCGA 


2280 


AATGATGCTG 


TAGTTACTCA 


AGTGTTTGGA 


ACTAATGTAA 


CAAACAACAC TTCTGTAAAC 


2340 


TTAGCAGCAG 


GTACTTTCGA 


CACTGACGAT 


ACTTTAACAG 


TAGTATTTGA TAAGTTGTTA 


2400 


GCACCTGAAA 


CTGTAAACAG 


CTCGAACGTT 


ACTATTACAG 


ATGTTGAAAC TGGAAAACGC 


2460 


ATTCCAGTAA 


TTGCATCTAC 


TTCTGGTTCT 


ACAATTACTA 


TTACGTTAAA AGAAGCGTTA 


2520 


GTAACTGGTA 


AACAATATAA 


ACTTGCTATC 


AATAATGTTA 


AAACATTAAC TGGTTACAAT 


2580 


GCAGAAGCTT ACGAGTTAGT GTTCACTGCA AACGCATCAG 


CACCAACTGT TGCTACCGCT 


2640 


CCTACTACTT 


TAGGTGGTAC 


AACTTTATCT 


ACTGGTTCTC 


TTACAACAAA TGTTTGGGGT 


2700 


AAATTGGCTG 


GTGGTGTGAA 


TGAAGCTGGA 


ACTTATTATC 


CTGGTCrrCA ATTCACAACA 


2760 


ACGTTTGCTA 


CTAAGTTAGA 


CGAATCTACT TTAGCTGATA ACTTTGTATT AGTTGAAAAA 


2820 


GAATCTGGTA 


CAGTTGTTGC 


TTCTGAACTA AAATATAATG CAGACGCTAA AATGGTAACT 


2880 


TTAGTGCCAA 


AAGCGGACCT 


TAAAGAAAAT 


ACAATCTATC 


AAATCAAAAT TAAAAAAGGC 


2940 


TTGAAGTCCG 


ATAAAGGTAT 


TGAATTAGGC 


ACTGTTAACG 


AGAAAACATA TGAGTTCAAA 


3000 


ACTCAAGACT 


TAACTGCTCC 


TACAGTTATT 


AGCGTAACGT 


CTAAAAATGG CGACGCTGGA 


3060 


TTAAAAGTAA 


CTGAAGCTCA AGAATTTACT 


GTGAAGTTCT 


CAGAGAATTT AAATACATTT 


3120 


AATGCTACAA 


CCGTTTCGGG 


TAGCACAATC 


ACATACGGTC 


AAGTTGCTGT AGTAAAAGCG 


3180 
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Portsetzung Figur 4 

GGTGCAAACT TATCTGCTCT TACAGCAAGT GACATCATTC CAGCTAGTGT TGAAGCGGTT 3240 

ACTGGTCAAG ATGGAACATA CAAAGTGAAA GTTGCTGCTA ACCAATTAGA ACGTAACCAA 3300 

GGGTACAAAT TAGTAGTGTT CGGTAAAGGT GCAACAGCTC CTGTTAAAGA TGCTGCAAAT 3360 

GCAAATACTT TAGCAACTAA CTATATCTAT ACATTTACAA CTGAAGGTCA AGACGTAACA 3420 

GCACCAACGG TTACAAAAGT ATTCAAAGGT GATTCTTTAA AAGACGCTGA TGCAGTTACT 3480 

ACACTTACGA ACGTTGATGC AGGTCAAAAA TTCACTATCC AATTTAGCGA AGAATTAAAA 3540 

ACTTCTAGTG GTTCTTTAGT GGGTGGCAAA GTAACTGTCG AGAAATTAAC AAACAACGGA 3600 

TGGGTAGATG CTGGTACTGG AACAACTGTA TCAGTTGCTC CTAAGACAGA TGCAAATGGT 3660 

AAAGTAACAG CTGCTGTGGT TACATTAACT GGTCTTGACA ATAACGACAA AGATGCGAAA 3720 

TTGCGTCTGG TAGTAGATAA GTCTTCTACT GATGGAATTG CTGATGTAGC TGGTAATGTA 3780 

ATTAAGGAAA AAGATATTTT AATTCGTTAC AACAGCTGGA GACACACTGT AGCTTCTGTG 3840 

AAAGCTGCTG CTGACAAAGA TGGTCAAAAC GCTTCTGCTG CATTCCCAAC AAGCACTGCA 3900 

ATTGATACAA CTAAGAGCTT ATXAGTTGAA TTCAATGAAA CTGATTTAGC GGAAGTTAAA 3960 

CCTGAGAACA TCGTTGTTAA AGATGCAGCA GGTAATGCGG TAGCTGGTAC TGTAACAGCA 4020 

TTAGACGGTT CTACAAATAA ATTTGTATTC ACTCCATCTC AAGAATTAAA AGCTGGTACA 4080 

GTTTACTCTG TAACAATTGA CGGTGTGAGA GATAAAGTAG GTAACACAAT CTCTAAATAC 4140 

ATTACTTCGT TCAAGACTGT ATCTGCGAAT CCAACGTTAT CTTCAATCAG CATTGCTGAC 4200 

GGTGCAGTTA ACGTTGACCG TTCTAAAACA ATTACAATTG AATTCAGCGA TTCAGTTCCA 4260 

AACCCAACAA TCACTCTTAA GAAGGCTGAC GGAACTTCAT TTACTAATTA CACTTTAGTA 4320 

AATGTAAATA ATGAAAATAA AACATACAAA ATTGTATTCC ACAAAGGTGT AACACTTGAC 4 3 BO 

GAGTTTACTC AATATGAGTT AGCAGTTTCA AAAGATTTTC AAACTGGTAC TGATATTGAT 4440 

AGCAAAGTTA CATTCATCAC AGGTTCTGTT GCTACTGACG AAGTAAAACC TGCTCTAGTA 4500 

GGCGTTGGTT CATGGAATGG AACAAGCTAT ACTCAGGATG CTGCAGCAAC ACGACTTCGG 4560 

TCTGTAGCTG ACTTCGTTGC GGAGCCAGTT GCCCTTCAAT TCTCAGAAGG TATCGATTTA 4620 

ACGAATGCAA CTGTGACAGT AACAAATATT ACTGATGATA AAACTGTTGA AGTTATTTCA 4680 

AAAGAGAGTG TAGACGCAGA CCATGATGCA GGTGCTACTA AGGAGACATT AGTAATTAAC 4740 

ACAGTTACTC CTTTAGTACT TGATAACAGC AAGACTTATA AGATTGTTGT AAGTGGAGTT 4 BOO 

stop SbsA 

AAAGATGCAG CAGGTAATGT TGCAGATACT ATTACATTCT ATATTAAGTA KTCTGGGCTA 4860 

GGTGTTTGTC ACCGCTCAAG GTTGTCAAAA TATGTCGAAA AGCTCTGCGG AGAGAAATCT 4920 

BamHI 

CTGCGGGGCT TTTCTTTTTG CTCAAATCTG TATC AGGATC C TCTAGAGTC GACCTGCAGG 4980 

CAAGCTTG 4988 
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Figur 5 

Nukleotidequenz eines SbsA-Gens fusioniert mit der Signalsequenz 
von Gen3 des Bakteriophagen fd j3768bp) 
Klonierung: SbsA (ohne ss" 
Merkmale : 

Position 48 bis 60: 
Position 3761 bis 3768: 
Position 61 bis 3657: 



iSfil-Notl) in pCANTABSE (Sfil-NotI) 

Sf il-Schnittstelle 
Notl-Schnittstelle 
SbsA-Gen ohne eigene Signalsequenz 



GTGAAAAAAT 
Start SbsA 
GCTACAGATG 



Signalsequenz 

TATTATTCGC AATTCCTTTA 
ohne signalsequenz 
TAGCAACAGT AGTAAGCCAA 



GTTGTTCCTT TCTATGCGGC 



Sfil 

CCAGCCGGCC 



ACTTACAGCC 
GAATACAACA 
GGCGCGAAAA 
AAAGCAAACC 
GCAACAAAAT 
GAAAAAGCAG 
TTAGATCGCG 
GCACAAGAAC 
GTACAAGACG 
AATCAATACT 
AAAGCATTAG 
AAGACTCAAA 
CAACTTTCAG 
GTGGACGGTA 
AAAACTATCA 
GTTAAAGGTA 
CTTCGAAATG 
GTAAACTTAG 
TTGTTAGCAC 
AAACGCATTC 
GCGTTAGTAA 
TACAATGCAG 
ACCGCTCCTA 



ATACAGTAAC GGAAACTGGT 
AAGCGAAAAA ACGATACCGT 
AAGACGCTTA CTTAGCTGAT 
CTAAATCTGG CGAAGCTCGT 
TAGACGAAAT GCGCCAAGAG 
AACAATACTA TCACAAAATT 
TATATGGTAA AACAACTCGT 
TTCGCGACAG CTTAATTTAT 
CTGTGAAAGC AGGCAATTTA 
TACCAAAAGT AACAGATGCT 
ATGCAGATGA AGCTGCGCTT 
ACAAAGCTGT TGAATTAACA 
CTGCTGCAAA TGAAGATACA 
ACATTCCATT TGCCCTTAAT 
CTGTGGATGC TTCAACTCCA 
TTAAAGACAA AAATGGCAAA 
ATGCTGTAGT TACTCAAGTG 
CAGCAGGTAC TTTCGACACT 
CTGAAACTGT AAACAGCTCG 
CAGTAATTGC ATCTACTTCT 
CTGGTAAACA ATATAAACTT 
AAGCTTACGA GTTAGTGTTC 
CTACTTTAGG TGGTACAACT 



GCAAAAGCAC AGTTCAAAAA 
GAATTCCCAA ACATTAACGA 
GATGCGGTAG CATTAGTGAA 
TTACAAAAAG AATATGAAAC 
GTAGCAACTT ACATCGATGC 
CTAGAGGCTG CTGTTCAAGC 
CCTTATGAAA TTAAAACTCG 
GATTTACTTC GCTCTACATT 
GATATTACGG TTGCAATGAA 
GACAAAGCTA AAGCTGCTGT 
TTCAAAACTG AACTAACAGA 
ACTCCAAAAG TTGAAAGTGT 
GCAGTACCAG TGAACGGAAC 
GTAAACGTAA ATACTGTACG 
ACGGCAGATG TTTCTTTATC 
TTCGAAAATA ATACGGAGTA 
GAATTTAAAG AAGATGCATT 
TTTGGAACTA ATGTAACAAA 
GACGATACTT TAACAGTAGT 
AACGTTACTA TTACAGATGT 
GGTTCTACAA TTACTATTAC 
GCTATCAATA ATGTTAAAAC 
ACTGCAAACG CATCAGCACC 
TTATCTACTG GTTCTCTTAC 



AGCATACTAT 
TGTATATGCT 
TAAAGCAGGT 
TTACGTTTTC 
TTACAACTAT 
AAAAGATTTA 
CACAGTCATT 
TAAAGCAAAA 
AGCGCGCGAA 
TGATCAAATC 
AGTAGCGAAA 
AAGTGCGATT 
ACTAAAATTA 
TATCTATAAA 
TACAGACGGA 
TAAAGTAGTA 
CACTTTCAAG 
CAACACTTCT 
ATTTGATAAG 
TGAAACTGGA 
GTTAAAAGAA 
ATTAACTGGT 
AACTGTTGCT 
AACAAATGTT 
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Forts etzung Figur 5 

TGGGGTAAAT TGGCTGGTGG TGTGAATGAA GCTGGAACTT ATTATCCTGG TCTTCAATTC 15 SQ 

ACAACAACGT TTGCTACTAA GTTAGACGAA TCTACTTTAG CTGATAACTT TGTATTAGTT 1620 

GAAAAAGAAT CTGGTACAGT TGTTGCTTCT GAACTAAAAT ATAATGCAGA CGCTAAAATG 16 BO 

GTAACTTTAG TGCCAAAAGC GGACCTTAAA GAAAATACAA TCTATCAAAT CAAAATTAAA 1740 

AAAGGCTTGA AGTCCGATAA AGGTATTGAA TTAGGCACTG TTAACGAGAA AACATATGAG 1800 

TTCAAAACTC AAGACTTAAC TGCTCCTACA GTTATTAGCG TAACGTCTAA AAATGGCGAC 1860 

GCTGGATTAA AAGTAACTGA AGCTCAAGAA TTTACTGTGA AGTTCTCAGA GAATTTAAAT 1920 

ACATTTAATG CTACAACCGT TTCGGGTAGC ACAATCACAT ACGGTCAAGT TGCTGTAGTA 1980 

AAAGCGGGTG CAAACTTATC TGCTCTTACA GCAAGTGACA TCATTCCAGC TAGTGTTGAA 2040 

GCGGTTACTG GTCAAGATGG AACATACAAA GTGAAAGTTG CTGCTAACCA ATTAGAACGT 2100 

AACCAAGGGT ACAAATTAGT AGTGTTCGGT AAAGGTGCAA CAGCTCCTGT TAAAGATGCT 2160 

GCAAATGCAA ATACTTTAGC AACTAACTAT ATCTATACAT TTACAACTGA AGGTCAAGAC 2220 

GTAACAGCAC CAACGGTTAC AAAAGTATTC AAAGGTGATT CTTTAAAAGA CGCTGATGCA 2280 

GTTACTACAC TTACGAACGT TGATGCAGGT CAAAAATTCA CTATCCAATT TAGCGAAGAA 2340 

TTAAAAACTT CTAGTGGTTC TTTAGTGGGT GGCAAAGTAA CTGTCGAGAA ATTAACAAAC 2400 

AACGGATGGG TAGATGCTGG TACTGGAACA ACTGTATCAG TTGCTCCTAA GACAGATGCA 2460 

AATGGTAAAG TAACAGCTGC TGTGGTTACA TTAACTGGTC TTGACAATAA CGACAAAGAT 2520 

GCGAAATTGC GTCTGGTAGT AGATAAGTCT TCTACTGATG GAATTGCTGA TGTAGCTGGT 2580 

AATGTAATTA AGGAAAAAGA TATTTTAATT CGTTACAACA GCTGGAGACA CACTGTAGCT 2640 

TCTGTGAAAG CTGCTGCTGA CAAAGATGGT CAAAACGCTT CTGCTGCATT CCCAACAAGC 2700 

ACTGCAATTG ATACAACTAA GAGCTTATTA GTTGAATTCA ATGAAACTGA TTTAGCGGAA 2760 

GTTAAACCTG AGAACATCGT TGTTAAAGAT GCAGCAGGTA ATGCGGTAGC TGGTACTGTA 2820 

ACAGCATTAG ACGGTTCTAC AAATAAATTT GTATTCACTC CATCTCAAGA ATTAAAAGCT 2880 

GGTACAGTTT ACTCTGTAAC AATTGACGGT GTGAGAGATA AAGTAGGTAA CACAATCTCT 2940 

AAATACATTA CTTCGTTCAA GACTGTATCT GCGAATCCAA CGTTATCTTC AATCAGCATT 3000 

GCTGACGGTG CAGTTAACGT TGACCGTTCT AAAACAATTA CAATTGAATT CAGCGATTCA 3060 

GTTCCAAACC CAACAATCAC TCTTAAGAAG GCTGACGGAA CTTCATTTAC TAATTACACT 3120 

TTAGTAAATG TAAATAATGA AAATAAAACA TACAAAATTG TATTCCACAA AGGTGTAACA 3180 

CTTGACGAGT TTACTCAATA TGAGTTAGCA GTTTCAAAAG ATTTTCAAAC TGGTACTGAT 3240 

ATTGATAGCA AAGTTACATT CATCACAGGT TCTGTTGCTA CTGACGAAGT AAAACCTGCT 3300 
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Fortsetzung Figur 5 

CTAGTAGGCG TTGGTTCATG GAATGGAACA AGCTATACTC AGGATGCTGC AGCAACACGA 3360 

CTTCGGTCTG TAGCTGACTT CGTTGCGGAG CCAGTTGCCC TTCAATTCTC AGAAGGTATC 3420 

GATTTAACGA ATGCAACTGT GACAGTAACA AATATTACTG ATGATAAAAC TGTTGAAGTT 3460 

ATTTCAAAAG AGAGTGTAGA CGCAGACCAT GATGCAGGTG CTACTAAGGA GACATTAGTA 3540 

ATTAACACAG TTACTCCTTT AGTACTTGAT AACAGCAAGA CTTATAAGAT TGTTGTAAGT 3600 

Stop SbsA 

GGAGTTAAAG ATGCAGCAGG TAATGTTGCA GATACTATTA CATTCTATAT TAAGTAATCT 3660 

GGGCTAGGTG TTTGTCACCG CTCAAGGTTG TCAAAATATG TCGAAAAGCT CTGCGGAGAG 3720 

Mot I 

AAATCTCTGC GGGGCTTTTC TTTTTGCTCA AATCTGTATC GCGGCCGC 3768 
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Figur 6 



Nukleotidsequenz eines SbsB-Gens fusioniert mit dem MalE-Gen 
einschlie&lich dessen Signalsequenz (4065bp) 

Klonierung: MalE aus pMal-p2 mt SbsB (ohne ss) in BamHI von MCS 
Merkmale : 

Position 1249 bis 1254: BamHI -Schnittstelle 

Position 4033 bis 4038: BamHI -Schnittstelle 

Position 1255 bis 3924: SbsB-Gen ohne eigene Signalsequenz 



Start MalE-Gen mit Signalsequenz 

^TGAAAATAA AAACAGGTGC ACGCATCCTC GCATTATCCG CATTAACGAC GATGATGTTT 
TCCGCCTCGG CTCTCGCCAA AATCGAAGAA GGTAAACTGG TAATCTGGAT TAACGGCGAT 
AAAGGCTATA ACGGTCTCGC TGAAGTCGGT AAGAAATTCG AGAAAGATAC CGGAATTAAA 
GTCACCGTTG AGCATCCGGA TAAACTGGAA GAGAAATTCC CACAGGTTGC GGCAACTGGC 
GATGGCCCTG ACATTATCTT CTGGGCACAC GACCGCTTTG GTGGCTACGC TCAATCTGGC 
CTGTTGGCTG AAATCACCCC GGACAAAGCG TTCCAGGACA AGCTGTATCC GTTTACCTGG 
GATGCCGTAC GTTACAACGG CAAGCTGATT GCTTACCCGA TCGCTGTTGA AGCGTTATCG 
CTGATTTATA ACAAAGATCT GCTGCCGAAC CCGCCAAAAA CCTGGGAAGA GATCCCGGCG 
CTGGATAAAG AACTGAAAGC GAAAGGTAAG AGCGCGCTGA TGTTCAACCT GCAAGAACCG 
TACTTCACCT GGCCGCTGAT TGCTGCTGAC GGGGGTTATG CGTTCAAGTA TGAAAACGGC 
AAGTACGACA TTAAAGACGT GGGCGTGGAT AACGCTGGCG CGAAAGCGGG TCTGACCTTC 
CTGGTTGACC TGATTAAAAA CAAACACATG AATGCAGACA CCGATTACTC CATCGCAGAA 
GCTGCCTTTA ATAAAGGCGA AACAGCGATG ACCATCAACG GCCCGTGGGC ATGGTCCAAC 
ATCGACACCA GCAAATTGAA TTATGGTGTA ACGGTACTGC CGACCTTCAA GGGTCACCCA 
TCCAAACCGT TCGTTGGCGT GCTGAGCGCA GGTATTAACG CCGCCAGTCC GAACAAAGAG 
TTGGCGAAAG AGTTCCTCGA AAACTATCTG CTGACTGATG AAGGTCTGGA AGCGGTTAAT 
AAAGACAAAC CGCTGGGTGC CGTAGCGCTG AAGTCTTACG AGGAAGAGTT GGCGAAAGAT 
CCACGTATTG CCGCCACCAT GGAAAACGCC CAGAAAGGTG AAATCATGCC GAACATCCCG 
CAGATGTCCG CTTTCTGGTA TGCCGTGCGT ACTGCGGTGA TCAACGCCGC CAGCGGTCGT 



60 
120 
180 
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300 
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600 
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1080 
1140 



CAGATCGTCG ATGAAGCCCT GAAAGACGCG CAGACTAATT CGAGCTCGAA CAACAACAAC 1200 

BamHI/ Start SbsB 

AATAACAATA ACAACAACCT CGGGATCGAG GGAAGGATTT CAGAATT CGG ATCC GCAAGC 1260 

TTCACAGATG TTGCGCCGCA ATATAAAGAT GCGATCGATT TCTTAGTATC AACTGGTGCA 1320 

ACAAAAGGTA AAACAGAAAC AAAATTCGGC GTTTACGATG AAATCACTCG TCTAGATGCG 13 80 

GC AG TT ATTC TTGCAAGAGT ATTAAAACTA GACGTTGACA ACGCAAAAGA CGCAGGCTTC 1440 

ACAGATGTGC CAAAAGACCG TGCAAAATAC GTCAACGCGC TTGTAGAAGC TGGCGTATTA 1500 
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Fortsetzung Figur 6 

AACGGTAAAG CACCTGGCAA ATTTGGTGCA TACGACCCAT TAACTCGCGT TGAAAE+eTGGCA 1560 

AAAATCATCG CGAACCGTTA CAAATTAAAA GCTGACGATG TAAAACTTCC ATTCACTGAT 1620 

GTAAACGATA CATGGGCACC ATACGTAAAA GCGCTTTATA AATACGAAGT AACAAAAGGT 1680 

AAAAC AC CAA CAAGCTTCGG TGCATACCAA AACATCACTC GCGGTGACTT TGCGCAATTT 1740 

GTATATAGAG CGGTGAATAT TAATGCAGTG CCAGAAATAG TTGAAGTAAC TGCGGTTAAT 1800 

TCGACTACAG TGAAAGTAAC ATTCAATACG CAAATTGCTG ATGTTGATTT CACAAATTTT 1860 

GCTATCGATA ACGGTTTAAC TGTTACTAAA GCAACTCTTT CTCGTGATAA AAAATCCGTA 192 0 

GAGGTTGTGG TAAATAAACC GTTTACTCGT AATCAGGAAT ATACAATTAC AGCGACAGGC 1980 

ATTAAAAATT TAAAAGGCGA GACCGCTAAG GAATTAACTG GTAAGT TTGT TTGGTCTGTT 2040 

CAAGATGCGG TAACTGTTGC ACTAAATAAT AGTTCGCTTA AAGTTGGAGA GGAATCTGGT 2100 

TTAACTGTAA AAGATCAGGA TGGCAAAGAT GTTGTAGGTG CTAAAGTAGA ACTTACTTCT 2160 

TCTAATACTA ATATTGTTGT AGTTTCAAGT GGCGAAGTAT CAGTATCTGC TGCTAAAGTT 2220 

ACAGCTGTAA AACCGGGAAC AGCTGATGTT ACTGCAAAAG TTACATTACC AGATGGTGTT 2280 

GTACTAACAA ATACATTTAA AGTGACAGTT ACAGAAGTGC CTGTGCAAGT ACAAAATCAA 2340 

GGATTTACTT TAGTTGATAA TCTTTCTAAT GCTCCACAGA ATACAGTTGC ATTTAACAAA 2400 

GCTGAGAAAG TAACTTCAAT GTTTGCTGGA GAAACTAAAA CAGTTGCAAT GTATGATACT 2460 

AAAAACGGTG ATCCTGAAAC TAAACCTGTT GATTTCAAAG ATGCAACTGT ACGTTCATTA 2520 

AATCCAATTA TTGCAACAGC TGCTATTAAT GGTAGTGAGC TCCTTGTCAC AGCTAATGCT 2580 

GGCCAATCTG GAAAAGCTTC ATTTGAAGTA ACATTTAAAG ATAATACAAA AAGAACATTT 2640 

ACAGTTGATG TGAAAAAAGA CCCTGTATTA CAAGATATTA AAGTAGATGC AACTTCTGTT 2700 

AAACTTTCCG ATGAAGCTGT TGGCGGCGGG GAAGTTGAAG GAGTTAAGCA AAAAACGATT 2760 

AAAGTAAGTG CAGTTGACCA ATACGGTAAA GAAATTAAAT TTGGTACAAA AGGTAAAGTT 2820 

ACTGTTACAA CTAATACAGA AGGACTAGTT ATTAAAAATG TAAATAGCGA TAATACAATT 2880 

GACTTTGATA GCGGCAATAG TGCAACTGAC CAATTTGTTG TCGTTGCAAC AAAAGACAAA 2940 

ATTGTCAATG GTAAAGTAGA AGTTAAATAT TTCAAAAATG CTAGTGACAC AACACCAACT 3000 
TCAACTAAAA CAATTACTGT TAATGTAGTG AATGTAAAAG CTGACGCTAC ACCAGTAGGA 30 60 
TTAGATATTG TAGCACCTTC TGAAATTGAT GTGAATGCTC CAAACACTGC TTCTACTGCA 3120 
GATGTTGATT TTATTAATTT CGAAAGTGTT GAGATTTATA CACTCGATTC TAATGGTAAC 3180 
CGTCTTAAAA AAGTTACTCC AACTGCAACT ACACTTGTAG GTACTAATGA TTATGTTGAA 3240 
GTTAATGGGA ATGTATTACA ATTCAAGGGT AACGATGAAT TAACGCTATT AACTTCTTCT 3300 
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Stop SbsB 
CTGTGACAAA ATAATTTTGA 


GATAATAACT 
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3900 
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